AskDonaのデモサイトー 令和6年版情報通信白書(PDF版)をAskDonaのRAGフレームワークで読み込ませた生成AIチャットと高度検索とは? 2024.08.26 AskDona RAG 目次 1. AskDonaのデモサイト1.0.1. ご利用開始前に必ず一読お願いいたします。1.0.2. AskDonaには『生成AIチャット』と『高度検索』があります。1.0.3. RAGは読み込ませたデータベースからのみ回答します1.0.4. デモ用に読み込ませたデータについて1.0.5. 『生成AIチャット』デモでご確認いただきたいこと1.0.6. 『高度検索』デモでご確認いただきたいこと1.1. 本デモ環境に利用した資料1.1.6.1. 総務省 令和6年版 情報通信白書令和6年能登半島地震における情報通信の状況/進化するデジタルテクノロジーとの共生https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/r06/pdf/index.html1.1.7. ChatGPTを組織で活用ご興味ある方はお気軽にご連絡ください AskDonaのデモサイトRAGの回答の質は資料を実際に読み込ませて回答を生成させることで評価できます。総務省が公表している令和6年版情報通信白書をAskDonaのRAGフレームワークに読み込んでいます。デモサイトはこちら ご利用開始前に必ず一読お願いいたします。 AskDonaには『生成AIチャット』と『高度検索』があります。 生成AIチャット→RAGのフレームワークを用いたプロダクトのこと。 高度検索→RAGのフレームワークのうち、最後の “Generation” を行わずにユーザーの質問に最も関連度の高い資料をデータベースからリスト化して表示するプロダクトのこと。 RAGは読み込ませたデータベースからのみ回答します RAG (Retrieval Augmented Generation / 検索拡張生成) は、事前に読み込ませたデータベースに対して、ユーザーが自然対話形式で質問して回答を得るフレームワークです。AskDonaには『生成AIチャット』と『高度検索』があり、『生成AIチャット』がRAGのフレームワークを用いたプロダクトで、『高度検索』はRAGのフレームワークのうち最後のGenerationを行わずに、ユーザーの質問に最も関連度の高い資料をデータベースからリスト化して表示するプロダクトです。 デモ用に読み込ませたデータについて このページの『生成AIチャット』と『高度検索』のデモ用に読み込ませたデータについてご説明します。 生成AIチャット→総務省が公開している『令和6年度 情報通信白書』から『AIの進化に伴う課題と現状の取組.pdf』というPDFを読み込ませています。 高度検索→総務省が公開している『令和6年度 情報通信白書』の第Ⅰ部と第Ⅱ部の全てを対象に合計36件のPDFを読み込ませています。 『生成AIチャット』デモでご確認いただきたいこと RAGのフレームワークそのものは一般的なものであり、誰でもRAGを活用したチャットボットを作成することができます。しかし、高い回答精度を出すことは容易ではありません。特に、読み込ませるデータに『表(テーブル)』や『チャート』、『画像』が含まれている場合に正しく回答できないケースがあります。データベースに読み込ませるドキュメントの数が多かったりや容量が大きい場合も回答精度が下がる傾向にあります。その点、AskDonaは独自のドキュメントプロセス技術を用いて、どのような表やチャート、画像が含まれている資料についても高い回答精度を実現しています。(1万6000ページを超えるPDFやその他の資料をデータベースに登録した理化学研究所様の導入事例はこちら) 生成AIチャットのデモ用に読み込ませた『AIの進化に伴う課題と現状の取組.pdf』には、以下の表やチャート、画像が含まれています。これらについて、ぜひ質問してみてください。 『高度検索』デモでご確認いただきたいこと 『高度検索』デモでは、『情報通信白書』の第Ⅰ部と第Ⅱ部の合計36件PDFを横断で検索できます。左側に『すべての検索結果』が表示され、右側に『検索結果の上位ファイル』が表示されます。 『すべての検索結果』では、データベース内にある36件のPDFがページ単位で検索結果として表示されます。検索結果をクリックすると、PDFの該当ページが表示されます。また、「カテゴリー」「フォーマット」「ファイル名」「本文」などの情報も検索結果内で表示されるため、別タブでPDFを開くことなく内容を確認できます。 『検索結果の上位ファイル』では、『すべての検索結果』に含まれていた検索結果をファイル単位で表示します。カテゴリーごとに最大5件、『すべての検索結果』に含まれている件数の降順で表示されるため、検索したキーワードに関連度の高いファイルを見つけやすくなります。 特に、『高度検索』は従来のキーワード検索とは異なり、RAGの技術を応用しているため、自然言語での検索が可能です。例えば、「生成AI」といったキーワード検索だけでなく、「生成AIのリスクを教えて」などの文章での検索が可能です。ぜひお試しください。 本デモ環境に利用した資料 総務省 令和6年版 情報通信白書令和6年能登半島地震における情報通信の状況/進化するデジタルテクノロジーとの共生https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/r06/pdf/index.html 第Ⅰ部特集①令和6年能登半島地震における情報通信の状況第1章令和6年能登半島地震における情報通信の状況第1節令和6年能登半島地震の概要(1.49MB)第2節通信、放送、郵便等の状況(2.41MB)第2章情報通信が果たした役割と課題第1節震災関連情報の収集と発信(3.14MB)第2節浮かび上がった課題と今後の対応(1.51MB)コラム1災害時における偽・誤情報への対応(2.03MB)特集②進化するデジタルテクノロジーとの共生第3章デジタルテクノロジーの変遷第1節AI進展の経緯と生成AIのインパクト(1.93MB)第2節AIの進化に伴い発展するテクノロジー(1.85MB)第4章デジタルテクノロジーの課題と現状の対応策第1節AIの進化に伴う課題と現状の取組(1.67MB) ※RAGに読み込ませたソース第2節AIに関する各国の対応(1.58MB)第3節その他デジタルテクノロジーに関する議論の動向(1.36MB)第5章デジタルテクノロジーの浸透第1節国民・企業における利用状況(1.63MB)第2節活用の現状・新たな潮流(1.26MB)第6章デジタルテクノロジーとのさらなる共生に向けて第1節デジタルテクノロジーとのさらなる共生に向けた課題と必要な取組(728KB)コラム2AIやロボットと協働・共生する未来に向けて(コンヴィヴィアルな関係)(398KB) 第Ⅱ部情報通信分野の現状と課題第1章ICT市場の動向第1節ICT産業の動向(1.52MB)第2節電気通信分野の動向(2.07MB)第3節放送・コンテンツ分野の動向(1.96MB)第4節我が国の電波の利用状況(1.62MB)第5節国内外におけるICT機器・端末関連の動向(1.8MB)第6節プラットフォームの動向(1.52MB)第7節ICTサービス及びコンテンツ・アプリケーションサービス市場の動向(1.7MB)第8節データセンター市場及びクラウドサービス市場の動向(1.96MB)第9節AIの動向(1.55MB)第10節サイバーセキュリティの動向(1.36MB)第11節デジタル活用の動向(2.78MB)第12節郵政事業・信書便事業の動向(1.68MB)第2章総務省におけるICT政策の取組状況第1節総合的なICT政策の推進(1.38MB)第2節電気通信事業政策の動向(1.53MB)第3節電波政策の動向(3.0MB)第4節放送政策の動向(2.08MB)第5節サイバーセキュリティ政策の動向(1.71MB)第6節ICT利活用の推進(1.62MB)第7節ICT技術政策の動向(1.58MB)政策フォーカス社会実装・海外展開を見据えたBeyond 5Gの推進戦略(1.31MB)第8節ICT国際戦略の推進(2.07MB)第9節郵政行政の推進(1.99MB) ChatGPTを組織で活用ご興味ある方はお気軽にご連絡ください 前の記事 理研の富岳サポートサイトが利用しているRAGとは?GFLOPS×理研 – AskDona 2024.08.23 次の記事 OpenAI社の次世代モデルGPT-5に何が期待できるか?リリース前に事前に把握したいChatGPTのモデル特徴 2024.09.03