プレスリリース 2020年

九州大学、ソフトバンクおよび豆蔵が、
データの品質を数理的に判定する
「データ格付け」の共同研究を開始

~産官学のデータの品質を明確化し、データの相互利用とデータ流通市場の活性化を目指す~

2020年11月26日
国立大学法人九州大学
ソフトバンク株式会社
株式会社豆蔵

国立大学法人九州大学(以下「九州大学」)、ソフトバンク株式会社(以下「ソフトバンク」)および株式会社豆蔵(以下「豆蔵」)は、企業や自治体、教育・研究機関などで蓄積されているさまざまなデジタルデータ(以下「データ」)について、データの品質を数学的な理論を用いて客観的に判定し、格付けとして明示する「データ格付け」の実現に向けた共同研究を、2020年11月から開始しました。3者は、「データ格付け」により産官学が保有するデータの品質を明確化することで、データの相互利用の促進や、データ流通市場の活性化を目指します。

1. 共同研究の背景と狙い

昨今、官民を挙げてさまざまな分野でDX(デジタルトランスフォーメーション)が推進されています。こうした中、企業や自治体、教育・研究機関などが組織内で記録・蓄積しているデータの相互利用は、DXにおける重要なテーマの一つとなっています。しかし、各組織が保有するデータは仕様や形式が異なる他、そのデータが利用に適した品質であるかどうかが明示されていないため、データを分析する際には、形式上の整合性の確認や、重複や誤記、表記の揺れなどを探して修正・削除するデータクレンジングなどの作業が必要になり、データの相互利用における大きな障壁となっています。

このたび九州大学、ソフトバンクおよび豆蔵の3者は、こうしたデータの相互利用における障壁を取り除くため、データの品質を数理的に判定して明示する「データ格付け」の実現に向けた共同研究を行います。「データ格付け」によってデータの品質を明確化することで、データの相互利用の促進やデータ流通市場の活性化が見込める他、さまざまなデータを掛け合わせた新たなビジネスの展開や、企業や自治体、教育・研究機関のさらなるDX推進につながると考えられます。

2. 共同研究の内容

共同研究では、「データ格付け」を行うための新しい数理基盤(アルゴリズム)を確立するとともに、クラウド環境と連携した「データ格付けサービス」の実装に向けた理論の構築と実証実験を行います。「データ格付けサービス」とは、クラウド環境にある各種データの品質を数理的に判定し、格付けとして明確化するサービスです。このサービスを実装するためには、「データ格付け」を可能な限り自動化することが必要なため、数理基盤やAI(人工知能)の活用を想定しています。データが形式的な要件を満たしているかどうかを数理基盤で判定し、データ利用者に提供可能な品質かを自動で格付けする他、AIの活用によりデータの品質を保証する仕組みも検討します。

なお、この共同研究において、「データ格付け」の理論構築は九州大学と豆蔵が主担当となり、理論の実装および実証実験は、九州大学とソフトバンクが主担当として実施します。

「データ格付けサービス」のイメージ

「データ格付けサービス」のイメージ

3. 今後の予定

今後3者は、下記のスケジュールで共同研究を進めていく予定です。

数理基盤や理論の構築 2021年1月まで
実証実験の環境構築 2021年5月まで
実証実験の実施 2021年7月まで

また、共同研究の開始に伴って、「デジタル・ニッポンの実現に向けたデータ格付け数理基盤に関するシンポジウム」を、2020年12月14日の午後1時から開催します(主催:九州大学)。このシンポジウムでは、九州大学、ソフトバンクおよび豆蔵の他、データの活用や研究に携わるゲストによる講演を予定しています。当日はオンライン(Zoom)での開催を予定しており、事前に申し込みをした方はどなたでも参加していただけます。シンポジウムの詳細および参加方法は、下記のウェブサイトをご覧ください。

シンポジウムのウェブサイトURL:https://imi.kyushu-u.ac.jp/~data_rating_sympo/

  • SoftBankおよびソフトバンクの名称、ロゴは、日本国およびその他の国におけるソフトバンクグループ株式会社の登録商標または商標です。
  • その他、このプレスリリースに記載されている会社名および製品・サービス名は、各社の登録商標または商標です。