株式会社モルフォAIソリューションズ、LLM向けの日本語データセット生成サービスを提供開始
株式会社モルフォAIソリューションズ以下 モルフォAIS)は12月19日、日本語LLM(Large Language Model:大規模言語モデル)の学習データを生成するための、AI-OCR(Optical Character Recognition:光学文字認識)出力サービスの提供を開始した。
このサービスは、独自LLMの構築を検討されている組織(企業・官公庁・地方自治体等)やLLM開発を進めるAI企業・研究機関向けに正確で多様な日本語テキストデータを提供。
概要
<サービス内容>
既存文書(社史・広報誌・公文書・議事録等)のデジタル化とLLM学習データへの変換
<特徴>
①帳票ではなく、文書に対応したAI-OCR
– LLMに入力する際に重要な読み順まで再現
– 文字種は約7000種類で、複雑な漢字も読み取り可能
②画像(JPEG,PDF,PNG等)が含まれている雑多な文書を、テキスト(様々なフォーマット)で出力可能
<リンク>
https://prtimes.jp/main/html/rd/p/000000097.000064140.html
投稿者プロフィール
おすすめ記事Recommended Articles
-
【Excelテンプレ有り】2024年版 年間販促カレンダーを無料ダウンロード/販促計画のお供に!
2023.12.28 お役立ち資料 -
【2023最新】画像生成AIとは?仕組みやおすすめツール5選
2023.11.13 DXツール -
年末年始にWeb広告を配信するメリットとは?おすすめ業界もご紹介
2023.11.02 DXトピックス -
年賀状の代わりに考える!新規顧客へアピールする新年の挨拶、ホームページ活用術
2023.11.01 DXトピックス -
ステマ規制とは?2023年10月から何が違法?ステルスマーケティングは景表法違反に
2023.09.12 DXトピックス -
生成AIとは?文章・画像生成AIの活用と問題点。企業は利用すべきか。
2023.05.19 DXトピックス
DXニュースについてABOUT DX NEWS
デジタルトランスフォーメーションを推進するにあたって参考となる国内外の事例、
デジタルマーケティングを自社内で行うインハウス化に関するお役立ち情報を提供しています。