アライン株式会社、生成AIを利用したファイル検索サービス「デジタルライブラリ」をリリース。類似検索が可能に
アライン株式会社(代表取締役:清水 剛)は7月23日、ファイル検索サービス「デジタルライブラリ」をリリースした。
デジタルライブラリとは
デジタルライブラリは、共有ストレージにアップロードされたあらゆる形式のファイル(テキスト、画像、PDFなど)の内容を解析し、ユーザーの検索意図を汲んだ検索を行う生成AIを利用した検索サービス。
たとえば「デジタル化」をキーワードとして検索した場合、「DX」などの関連キーワードも一緒に抽出して質問意図に合致する資料を表示できる。
▼デジタルライブラリの検索画面イメージ
デジタルライブラリの特徴
デジタルライブラリの主な特徴は、以下のとおり。
- 「登録」「検索」のみのシンプルなサービス
- ユーザーの検索意図に沿った類似検索ができる
- 数百ページに及ぶ大きなファイルでもページ単位で解析・検索できる
- OCRにより画像やPDFなどのファイルに含まれるテキストも解析・検索できる
- 英語や日本語の他、あらゆる言語に対応している
デジタルライブラリの仕組み
キーワード一致ではなく類似検索を可能にする仕組みとして、ファイルの登録時に作成するEmbeddingと呼ばれるベクトルデータベースを採用している。
ファイルに含まれるテキストデータを解析・抽出して、ページごとにEmbeddingとしてベクトル化してデータベースに保存する。
検索時には、ユーザーが入力したキーワードやセンテンスも同様にEmbeddingとしてベクトル化し、データベースの全てのベクトルと総当たりでコサイン類似度を計算する。
最終的に、コサイン類似度が高い順に、ファイル名、表紙のサムネイル、該当ページ番号、該当ページに含まれるテキストの一部抜粋を表示する。
<リンク>
https://prtimes.jp/main/html/rd/p/000000009.000085096.html
投稿者プロフィール
おすすめ記事Recommended Articles
-
【Excelテンプレ有り】2024年版 年間販促カレンダーを無料ダウンロード/販促計画のお供に!
2023.12.28 お役立ち資料 -
【2023最新】画像生成AIとは?仕組みやおすすめツール5選
2023.11.13 DXツール -
年末年始にWeb広告を配信するメリットとは?おすすめ業界もご紹介
2023.11.02 DXトピックス -
年賀状の代わりに考える!新規顧客へアピールする新年の挨拶、ホームページ活用術
2023.11.01 DXトピックス -
ステマ規制とは?2023年10月から何が違法?ステルスマーケティングは景表法違反に
2023.09.12 DXトピックス -
生成AIとは?文章・画像生成AIの活用と問題点。企業は利用すべきか。
2023.05.19 DXトピックス
DXニュースについてABOUT DX NEWS
デジタルトランスフォーメーションを推進するにあたって参考となる国内外の事例、
デジタルマーケティングを自社内で行うインハウス化に関するお役立ち情報を提供しています。