Javaによるテキスト検索エンジンライブラリApache Lucene Java 2.3.0
オープンソースの検索エンジンApache Lucene Java 2.3.0では、インデクスパフォーマンスが大幅に向上した。
The Apache Lucene Project は1月26日、Apache Luceneの最新版であるApache Lucene Java 2.3.0をリリースした。ライセンスはApache License, Version 2.0。
Apache Luceneは、Javaで記述されたオープンソースのテキスト検索エンジンライブラリ。全文検索を必要とするほとんどのアプリケーションに適しており、特にクロスプラットフォームの場合にはより適しているという。
必要とするRAMが1MBのヒープのみという小ささ、バッチインデクシングと同じくらいの速さの増分インデクシング、インデックスのサイズがインデックス化されたテキストのおよそ20から30%程度、といった特徴がある。また、ランク付け検索を始めとして、フレーズ・ワイルドカード・近似値・範囲クエリなどへの対応、フィールド検索、日付範囲検索、フィールドによるソート、マージされた結果を検索する複合インデックス、更新と検索の同時実行など、強力で効率的な検索アルゴリズムを持っている。
今回のリリースでは、インデクシングパフォーマンスで大きな最適化が行われた。IndexWriterがドキュメントをバッファリングする際のRAMの使用方法を改良することで、インデクシングが2倍から8倍ほどスピードアップしているという。
そのほか、バッググラウンドスレッドでのセグメントの結合、IndexReaderクラスへのメソッド追加、StandardAnalyzerの速度アップとToken APIの改良、破損したインデックスを検査・回復するためのCheckIndexツールなどを含む、多くの新機能の追加、最適化、そしてバグフィックスが行われている。
変更点の詳細については、Change Logを参照して頂きたい。
- 0人の推薦記事
- 0人がクリップ
-
ソーシャルブックマーク(-)
- トラックバック(0)
- 2日前のトップ記事
- 3日前
- 4日前
- 5日前
- 6日前
- ホワイトペーパー
- 話題のタグ
キャリアコンサルタントのノウハウが最大の強みです
動画再生耐久レース―フル充電からどれだけ耐えた?
心当たりありませんか--あなたの上司がイヤがる5つの話し方
フォームデザイン虎の巻:複数の選択肢を提供する
フォトレポート:技術サポートの悪夢
無料の「Oracle Database XE」で高速バッチ処理:実装のポイント
Firefoxで情報をカンタン・ベンリに整理する
iPhone Safari、Acidテストでは高得点でも…… Firefoxは載らないの?:WebサイトのiPhone 3G対応問題を考える(ソフト編)
WebサイトのiPhone 3G対応問題を考える(ハード編)
フォトレポート:時代を振り返る--「MS-DOS 4」のインストール
SOAと仮想化の関係は?--常に進化を続けるBEAのミドルウェア戦略
ウェブ開発の生産性はどうしたら上がる?--MODIPHI Appsで半日で作るマッシュアップサイト(1)
JailBreakついに:PwnageTool公開
プロジェクトの進行でよくある4つのトラブル
ZDNet Japan Green IT
ZDNet Japan ホスティング特集
DELLが掲げる「新・仮想化アセスメントサービス」
Techno Exchange