WekaManual

  • View
    48

  • Download
    1

Embed Size (px)

Text of WekaManual

WEKA Manualfor Version 3-6-5Remco R. BouckaertEibe FrankMark HallRichard KirkbyPeter ReutemannAlex SeewaldDavid ScuseJune 28, 2011c _2002-2011University of Waikato, Hamilton, New ZealandAlex Seewald (original Commnd-line primer)David Scuse (original Experimenter tutorial)This manual is licensed under the GNU General Public Licenseversion 2. More information about this license can be found athttp://www.gnu.org/copyleft/gpl.htmlContentsI The Command-line 111 A command-line primer 131.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131.2 Basic concepts . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141.2.1 Dataset . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141.2.2 Classier . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.2.3 weka.lters . . . . . . . . . . . . . . . . . . . . . . . . . . 171.2.4 weka.classiers . . . . . . . . . . . . . . . . . . . . . . . . 191.3 Examples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23II The Graphical User Interface 252 Launching WEKA 273 Simple CLI 313.1 Commands . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313.2 Invocation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323.3 Command redirection . . . . . . . . . . . . . . . . . . . . . . . . 323.4 Command completion . . . . . . . . . . . . . . . . . . . . . . . . 334 Explorer 354.1 The user interface . . . . . . . . . . . . . . . . . . . . . . . . . . 354.1.1 Section Tabs . . . . . . . . . . . . . . . . . . . . . . . . . 354.1.2 Status Box . . . . . . . . . . . . . . . . . . . . . . . . . . 354.1.3 Log Button . . . . . . . . . . . . . . . . . . . . . . . . . . 364.1.4 WEKA Status Icon . . . . . . . . . . . . . . . . . . . . . . 364.1.5 Graphical output . . . . . . . . . . . . . . . . . . . . . . . 364.2 Preprocessing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374.2.1 Loading Data . . . . . . . . . . . . . . . . . . . . . . . . . 374.2.2 The Current Relation . . . . . . . . . . . . . . . . . . . . 374.2.3 Working With Attributes . . . . . . . . . . . . . . . . . . 384.2.4 Working With Filters . . . . . . . . . . . . . . . . . . . . 394.3 Classication . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414.3.1 Selecting a Classier . . . . . . . . . . . . . . . . . . . . . 414.3.2 Test Options . . . . . . . . . . . . . . . . . . . . . . . . . 414.3.3 The Class Attribute . . . . . . . . . . . . . . . . . . . . . 424.3.4 Training a Classier . . . . . . . . . . . . . . . . . . . . . 4334 CONTENTS4.3.5 The Classier Output Text . . . . . . . . . . . . . . . . . 434.3.6 The Result List . . . . . . . . . . . . . . . . . . . . . . . . 434.4 Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454.4.1 Selecting a Clusterer . . . . . . . . . . . . . . . . . . . . . 454.4.2 Cluster Modes . . . . . . . . . . . . . . . . . . . . . . . . 454.4.3 Ignoring Attributes . . . . . . . . . . . . . . . . . . . . . . 454.4.4 Working with Filters . . . . . . . . . . . . . . . . . . . . . 464.4.5 Learning Clusters . . . . . . . . . . . . . . . . . . . . . . . 464.5 Associating . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 474.5.1 Setting Up . . . . . . . . . . . . . . . . . . . . . . . . . . 474.5.2 Learning Associations . . . . . . . . . . . . . . . . . . . . 474.6 Selecting Attributes . . . . . . . . . . . . . . . . . . . . . . . . . 484.6.1 Searching and Evaluating . . . . . . . . . . . . . . . . . . 484.6.2 Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . 484.6.3 Performing Selection . . . . . . . . . . . . . . . . . . . . . 484.7 Visualizing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504.7.1 The scatter plot matrix . . . . . . . . . . . . . . . . . . . 504.7.2 Selecting an individual 2D scatter plot . . . . . . . . . . . 504.7.3 Selecting Instances . . . . . . . . . . . . . . . . . . . . . . 515 Experimenter 535.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 535.2 Standard Experiments . . . . . . . . . . . . . . . . . . . . . . . . 545.2.1 Simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 545.2.1.1 New experiment . . . . . . . . . . . . . . . . . . 545.2.1.2 Results destination . . . . . . . . . . . . . . . . 545.2.1.3 Experiment type . . . . . . . . . . . . . . . . . . 565.2.1.4 Datasets . . . . . . . . . . . . . . . . . . . . . . 585.2.1.5 Iteration control . . . . . . . . . . . . . . . . . . 595.2.1.6 Algorithms . . . . . . . . . . . . . . . . . . . . . 595.2.1.7 Saving the setup . . . . . . . . . . . . . . . . . . 615.2.1.8 Running an Experiment . . . . . . . . . . . . . . 625.2.2 Advanced . . . . . . . . . . . . . . . . . . . . . . . . . . . 635.2.2.1 Dening an Experiment . . . . . . . . . . . . . . 635.2.2.2 Running an Experiment . . . . . . . . . . . . . . 665.2.2.3 Changing the Experiment Parameters . . . . . . 685.2.2.4 Other Result Producers . . . . . . . . . . . . . . 755.3 Cluster Experiments . . . . . . . . . . . . . . . . . . . . . . . . . 805.4 Remote Experiments . . . . . . . . . . . . . . . . . . . . . . . . . 835.4.1 Preparation . . . . . . . . . . . . . . . . . . . . . . . . . . 835.4.2 Database Server Setup . . . . . . . . . . . . . . . . . . . . 835.4.3 Remote Engine Setup . . . . . . . . . . . . . . . . . . . . 845.4.4 Conguring the Experimenter . . . . . . . . . . . . . . . . 855.4.5 Multi-core support . . . . . . . . . . . . . . . . . . . . . . 865.4.6 Troubleshooting . . . . . . . . . . . . . . . . . . . . . . . 865.5 Analysing Results . . . . . . . . . . . . . . . . . . . . . . . . . . . 885.5.1 Setup . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 885.5.2 Saving the Results . . . . . . . . . . . . . . . . . . . . . . 915.5.3 Changing the Baseline Scheme . . . . . . . . . . . . . . . 915.5.4 Statistical Signicance . . . . . . . . . . . . . . . . . . . . 92CONTENTS 55.5.5 Summary Test . . . . . . . . . . . . . . . . . . . . . . . . 925.5.6 Ranking Test . . . . . . . . . . . . . . . . . .