Erlang:一個(gè)通用的網(wǎng)絡(luò)服務(wù)器
2010-01-13 23:12:05
導(dǎo)語(yǔ): 前面幾篇文章里談到了Erlang的gen_tcp網(wǎng)絡(luò)編程和Erlang/OPT的gen_server模塊,現(xiàn)在讓我們將它們兩者綁定在一起
關(guān)鍵詞:服務(wù)器 網(wǎng)絡(luò)
Lucene進(jìn)階:and 和or的條件查詢
2010-01-13 23:10:41
導(dǎo)語(yǔ): 在用Lucene實(shí)現(xiàn)全站搜索的過(guò)程中,很可能會(huì)遇到這樣的問(wèn)題,只所有某種特定的信息資源,而不是全部.如:某綜合性站點(diǎn),有新聞,產(chǎn)品,論壇,Blog,視頻等資源,而搜索的時(shí)候先選一個(gè)類型(下拉列表),再輸入關(guān)鍵字進(jìn)行搜索(當(dāng)
Lucene(Lucence)建立索引(字段)
2010-01-13 23:09:43
導(dǎo)語(yǔ): Lucene,這是官方稱謂,也有許多人叫它Lucence,做搜索和分詞用的工具包.也有人說(shuō)是Java下的搜索引擎框架庫(kù),見(jiàn)仁見(jiàn)智的說(shuō)法罷了.不管叫什么,確實(shí)非常有用,比如做全站的搜索,其實(shí)它的用處遠(yuǎn)大于此,但凡涉及到文本搜索
基于lucene的對(duì)數(shù)據(jù)庫(kù)&文件夾檢索(ss2,appfus
2010-01-13 23:07:57
導(dǎo)語(yǔ): 整個(gè)工程文件和src,lib包可以用ss2下lib包。
Lucene應(yīng)用的一點(diǎn)體會(huì)
2010-01-13 23:07:22
導(dǎo)語(yǔ): Lucene應(yīng)用(我用的是Lucene2.1.0,有些觀點(diǎn)有可能也不太正確)1.多線程索引,共享同一個(gè)IndexWriter對(duì)象這種方式效率很慢,主要原因是因?yàn)椋簀ava 代碼 public void addDocument(Document doc, Analyzer
關(guān)鍵詞:應(yīng)用
帶局部統(tǒng)計(jì)識(shí)別高頻詞匯及人名識(shí)別的Lucene中文
2010-01-13 23:06:10
導(dǎo)語(yǔ): 經(jīng)過(guò)努力終于在 引入局部統(tǒng)計(jì)識(shí)別高頻詞匯的Lucene中文分詞程序 以及 基于詞典的最大匹配的Lucene中文分詞程序 把中文人名識(shí)別功能加入,能把大部分的中文姓名識(shí)別出來(lái),結(jié)果喜人。
Lucene Hack之通過(guò)縮小搜索結(jié)果集來(lái)提升性能 (1)
2010-01-13 23:05:21
導(dǎo)語(yǔ): 一、緣起
基于詞典的最大匹配的Lucene中文分詞程序
2010-01-13 23:04:42
導(dǎo)語(yǔ): 把自己之前完成的基于詞典的最大匹配的中文分詞程序修改成基于Lucene。其中包括了3種詞典的組織形式:簡(jiǎn)單順序存儲(chǔ)SimpleDictionary,首字Hash詞典HashDictionary,雙重Hash詞典;例外實(shí)現(xiàn)了兩種分詞算法:正向最大