中国 世界初の1億パラメータ数の地震波大規模言語モデル「諦聴」を発表

2024-07-31 12:12:17  CRI

国家スーパーコンピューティング成都センターで行われた「諦聴」地震波大規模言語モデル発表会

 世界初の1億パラメータ数の地震波大規模言語モデル「諦聴」の発表会が29日、中国南西部四川省成都市にある国家スーパーコンピューティング成都センターで行われました。「諦聴」地震波大規模言語モデルの発表は、中国の地震の監視測定、早期警報、予兆識別などの重要な技術分野での成果とされています。

 紹介によりますと、「諦聴」データセットは現在、地震学の専門家向けAIトレーニングデータセットとしては世界最大かつ最も包括的なサンプルタイプとアノテーションの一つです。この大規模言語モデルは国家スーパーコンピューティング成都センター、中国地震局地球物理研究所と清華大学が共同で開発したものです。

 中国地震局地球物理研究所の陳石副所長は、「諦聴」大規模言語モデルは中国の地震観測ネットワークの膨大なデータに基づき、人工知能(AI)技術を通じて、地震信号の識別精度と速度を著しく向上させたと紹介しました。短期的には、地震波大規模言語モデルは地震信号識別、地震活動監視、大地震への迅速な対応などの分野に応用されます。長期的には、地震学は観測科学であり、重大な進展は往々にして観測データを深く理解することによって得られます。現在、従来の方法と中小モデルではTB、PBレベルの地震観測データを十分に利用することができませんが、これらのデータには地震学的に多くの重要な問題が含まれているため、地震波大規模言語モデルは長期的には地震科学の研究に重大な進展をもたらすことが期待されます。

 現在、この大規模言語モデルは既に使用可能な状態にあるとともに、8月には10億パラメータ数のバージョンが事前訓練を終える予定で、新時代の耐震・減災事業の現代化に科学技術による一層の支援を提供していくものと見られています。今後、このモデルの応用シーンは鉱物の採掘に伴って発生する地震に対するモニタリング、シェールガス採掘、都市地下空間の構造探査、海底地震のモニタリングなど、多くの分野に使用できるということです。(藍、坂下)

KANKAN特集

ラジオ番組
KANKAN特集