河东软件园:绿色免费的软件下载站! 最新软件|软件分类|软件专题|软件发布

所在位置:首页 > 网络软件 > 数据库类 > weka(数据挖掘软件) 3.7.12 官方最新版

weka(数据挖掘软件)

 3.7.12 官方最新版
  • 软件大小:66.6 MB
  • 更新日期:2017-05-26
  • 软件语言:英文
  • 软件类别:数据库类
  • 软件授权:免费软件
  • 软件官网:
  • 适用平台:WinXP, Win7, Win8, Win10, WinAll
  • 软件厂商:

8.9
软件评分

本地下载文件大小:66.6 MB 高速下载需下载高速下载器,提速50%

软件介绍人气软件相关文章网友评论下载地址

为您推荐:数据库类

  weka是款非常强大的综合性数据挖掘工具;它集合了数据预处理、分类、学习算法、关联分析等等,拥有的评估方法,使软件受到了大量的好评,而且夜可以将软件叫做怀卡托智能分析环境,拥有的用户界面非常的友好,采用了目前非常先进的交互式可视化界面,让您的操作更加的直接,也更加的方便,还可通过软件,来快速的实现您的数据挖掘算法等,需要的朋友赶快将weka(数据挖掘软件)下载来使用试试吧!

weka(数据挖掘软件) 3.7.12 官方最新版

软件功能

  WEKA文件相关术语

  表格里的一个横行称作一个实例(Instance),相当于统计学中的一个样本,或者数据库中的一条记录。竖行称作一个属性(Attribute),相当于统计学中的一个变量,或者数据库中的一个字段。这样一个表格,或者叫数据集,在WEKA看来,呈现了属性之间的一种关系(Relation)。上图中一共有14个实例,5个属性,关系名称为“weather”。

  WEKA存储数据的格式是ARFF(Attribute-Relation File Format)文件,这是一种ASCII文本文件。上图所示的二维表格存储在如下的ARFF文件中。这也就是WEKA自带的“weather.arff”文件,在WEKA安装目录的“data”子目录下可以找到。

  文件内容说明

  识别ARFF文件的重要依据是分行,因此不能在这种文件里随意的断行。空行(或全是空格的行)将被忽略。以“%”开始的行是注释,WEKA将忽略这些行。如果你看到的“weather.arff”文件多了或少了些“%”开始的行,是没有影响的。

  除去注释后,整个ARFF文件可以分为两个部分。

  第一部分给出了头信息(Head information),包括了对关系的声明和对属性的声明。

  第二部分给出了数据信息(Data information),即数据集中给出的数据。从“@data”标记开始,后面的就是数据信息了。

  关系声明

  关系名称在ARFF文件的第一个有效行来定义,格式为@relation

  是一个字符串。如果这个字符串包含空格,它必须加上引号(指英文标点的单引号或双引号)。

  数值属性

  数值型属性可以是整数或者实数,但WEKA把它们都当作实数看待。

软件特色

  weka本身有一个GUI,通过java -jar weka.jar启动。然后点击Explorer启动子程序(我只学了Explorer)。

  在weka explorer中点击OpenFile打开*.arff格式的数据。arff其实就是文本文件。

  weka explorer顶部标签的第二个标签,可以进行分类相关的分析,如回归分析、分类分析、临近分析等。

  利用第三个标签为集群相关的分析可以进行聚类分析等。

  算法是在标签的Classifier中的Choose按钮中选择的,其中,

  以树的形式展示分类分析是用:Classify->Choose->Classifiers->trees->J48; 对应java类(weka.classifiers.trees.J48;)

  回归分析是:Classify->Choose->Classifiers->Functions->LinearRegression 刚刚注意到界面上有这个类(weka.classifiers.functions.LinearRegression),也许就是用java编程时要用到的。

  聚类分析是:Cluster->Choose->clusterers->SimpleKMeans

  邻近分析是:Classify->Choose->Classifiers->lazy->IBK

使用方法

  GUI软件包管理器

  还有一个命令行客户端,也有图形界面的数据包管理系统。这可从“工具”菜单中的guichooser。所有的命令行客户端的功能包管理系统可在GUI版本,以及能够安装和卸载多个包在一个打击。

weka(数据挖掘软件) 3.7.12 官方最新版

  包管理器的窗口水平拆分为两部分:顶部是一个包列表,底部是一个微型浏览器,可以用来显示当前选定包的信息。

  包列表显示了包的名称、类别、当前已安装的版本(如果已安装)、通过存储库提供的最新版本以及包是否已加载。此列表可以通过单击相应的列标头来对每个包名或类别进行排序。

weka(数据挖掘软件) 3.7.12 官方最新版

  在同一头上单击第二次会颠倒排序顺序。在窗口左上角的三个单选按钮可以用来过滤列表中显示的内容。所有包(默认),所有可用的包(即那些尚未安装)或仅安装包可以显示。如果一个包的多个版本可用,则可以通过单击“存储库版本”列中的条目来访问它们:

weka(数据挖掘软件) 3.7.12 官方最新版

  安装和移除包

  在窗口的顶部有三个按钮。左边是一个按钮,可以用来刷新包存储库元数据的缓存副本。第一次使用包管理器(GUI或命令行)时,将有一个短的延迟作为初始缓存建立。注:Weka(3.7.2)将不会自动检查新信息的中央存储库,所以它刷新本地缓存经常是一个好主意。从Weka 3.7.3包管理器将有在中央存储库中可用的新包装的通知你。

weka(数据挖掘软件) 3.7.12 官方最新版

  两个按钮在右上用来安装和删除软件包repspectively。通过使用左键单击组合来选择多个包,可以通过选择左键单击组合来选择范围和/或添加到选择中。下面的安装和卸载,但吨是一个复选框,可以使忽略任何依赖关系所需的选定包和任何冲突,可能会发生。在选中此复选框时安装包将不会安装所需的依赖项。

  一些包可能有关于如何完成安装或安装包时显示的特殊指令的附加信息:

weka(数据挖掘软件) 3.7.12 官方最新版

常见问题

  我可以使用CSV文件吗?

  是,你可以。但要注意,有在ARFF文件比较多的缺点(Weka的默认文件格式):

  不能增量读取CSV文件。为了确定列是数字还是标称,所有行都需要先检查。arff文件包含标题定义属性,即内部数据结构可以设置正确的阅读实际数据之前。

  列车和测试集可能不兼容。使用CSV文件作为火车和测试集可以是一个令人沮丧的练习。从CSV文件不包含任何信息的属性,WEKA需要确定名义属性本身的标签。不仅是这些标签出现的顺序创建名义属性不同(“1,2,3”VS“1”),但它并不能保证所有的标签在火车上出现,也出现在测试集(“1,2,3,4”与“天”),反之亦然。

  我能在WEKA查看我的路径?

  是,你可以。刚开始的simplecli并发出以下命令:

  java weka.core.systeminfo

  找物业java.class.path,其中列出了classpath WEKA开始。

更新说明

  有两个版本:3.8是weka weka最新的稳定版本,3.9版本的开发和Weka。对于出血边缘,也可以下载夜间快照。

  稳定版本只接收bug修复,而开发版本接收新功能。3.8和3.9特征WEKA的包管理系统,便于Weka社区WEKA添加新功能。包管理系统需要Internet连接,以便下载和安装包。

  注(1)用户从WEKA 3.7升级到3.8或更高版本:如果weka weka的3.8包管理器无法启动,请删除包文件夹驻留在用户家wekafiles文件夹的文件installedpackagecache.ser。

  注(2)用户从WEKA 3.7升级到3.8或更高版本:序列化模型Weka中创建3.7不兼容3.8。我们有一个模型迁移工具,可以将一些模型是兼容3.8.0。一个例外是randomForest,可以迁移到3.7.13却没有进一步的。用法如下:

  java - CP <路径>:<路径modelmigrator。罐罐weka.core.modelmigrator Weka。>我<路径> -老序列化WEKA模型o<升级模型文件名>

下载地址

  • weka(数据挖掘软件) 3.7.12 官方最新版

    本地高速下载

人气软件

查看所有评论>>网友评论0

发表评论

您的评论需要经过审核才能显示

精彩评论

最新评论

盖楼回复X

(您的评论需要经过审核才能显示)