TECHNOLOGY DXツール
2023.12.19 DXツール

株式会社モルフォAIソリューションズ、LLM向けの日本語データセット生成サービスを提供開始

株式会社モルフォAIソリューションズ以下 モルフォAIS)は12月19日、日本語LLM(Large Language Model:大規模言語モデル)の学習データを生成するための、AI-OCR(Optical Character Recognition:光学文字認識)出力サービスの提供を開始した。
このサービスは、独自LLMの構築を検討されている組織(企業・官公庁・地方自治体等)やLLM開発を進めるAI企業・研究機関向けに正確で多様な日本語テキストデータを提供。

概要

<サービス内容>
既存文書(社史・広報誌・公文書・議事録等)のデジタル化とLLM学習データへの変換

<特徴>
①帳票ではなく、文書に対応したAI-OCR
– LLMに入力する際に重要な読み順まで再現
– 文字種は約7000種類で、複雑な漢字も読み取り可能
 
②画像(JPEG,PDF,PNG等)が含まれている雑多な文書を、テキスト(様々なフォーマット)で出力可能

<リンク>

https://prtimes.jp/main/html/rd/p/000000097.000064140.html

投稿者プロフィール

DXニュース編集部
DXニュース編集部

DXニュースについてABOUT DX NEWS

デジタルトランスフォーメーションを推進するにあたって参考となる国内外の事例、
デジタルマーケティングを自社内で行うインハウス化に関するお役立ち情報を提供しています。

CONTACT お問い合わせ

03-6263-9628

営業時間:平日9:00~18:00

メールでのお問い合わせ
お電話でのお問い合わせ

営業時間:平日9:00~18:00