「星期三的 meeting 延到今天。」這件事我在兩天內忘記而又被提醒了好幾次,連並非同 Lab 的同學都記得,我卻忘記了,真是慚愧 XD
雖然已經隔了兩天,但大家似乎都有其他事情要忙,因此今天還是沒有人有東西可以報告,不過剛好堅哥有新的 idea ,所以今天的 meeting 主要是堅哥在談他的 idea 。咪完之後,我因為報告終於都告一段落了,所以到 Lab 去查點論文的相關資料。
我繼續研究了一陣子 multiple pattern matching 演算法,然後覺悟到我實在沒必要把時間浪費在提昇邊際效益上,於是開始認識決策樹。我看了學弟妹的畢專論文對於決策樹的介紹後,實在無法瞭解他們選擇 ID3 的原因,如果要以最適用而論,我覺得 CART 的二分法相當適合他們,而如果要以最準確而論,改良自 ID3 的 C4.5 顯然更好。之後又看了一些其他的決策樹演算法簡介,我想 C4.5 是個不錯的研究目標。
接下來查到 Weka 這個軟體,雖然某人的 blog 上曾經提過,但我一直沒有興趣研究,因為我不會改 Java ,如果有需要對演算法作修改的話,還是用我熟悉的語言比較好。不過今天發現微軟竟然提供了 Java 轉 C# 的工具 ,所以我想或許可以參考一下用 Java 寫成的 Weka… XD
試用後才發現滿好用的,它實作了好多演算法任君選擇,效率也非常好,真是讓我心動。 ARFF 格式的資料也不難產生,只要稍微修改一下 Herbivora 便能使用,現在只差還沒有足夠的 Data 可以讓我玩——只有一種類型的 Data 是沒有辦法跑決策樹的 XD