Column

コラム

  • 【テックコラム】BigQuery の新機能、Gemini に...

【テックコラム】BigQuery の新機能、Gemini によるテーブル・カラムの説明の自動生成を解説

はじめに

こんにちは!ジョージです。

データ活用していると、プロジェクトの拡大と共にデータ基盤のテーブルやカラムの数はどんどん増えていきます。その中で、「このテーブルは何のデータだっけ?」「このカラムには何が入っているんだろう?」と迷子になった経験はないでしょうか。また、生成 AI によるデータの可視化がどんどん進んでいますが、「違うテーブルを参照してしまう」「カラムの意図を間違って解釈している」といった問題に直面した方も多いのではないでしょうか。

テーブルやカラムに設定された 説明(description)は、そうした迷子を防ぎ、データの内容を正確に理解するための道しるべとなります。しかし、数多くのテーブルやカラムに対して、一つひとつ手動で説明を登録していくのは非常に手間のかかる作業です。データの中身を正確に理解する必要もあり、なかなか骨が折れます。

今回は、この課題を解決する可能性を秘めたBigQueryの新機能をご紹介します。

【プレビュー版】Geminiによる説明自動生成機能が登場

2025年6月18日のリリースノートで、Geminiを使用してBigQueryのテーブルとカラムの説明を自動生成する機能がプレビュー版として公開されました。

こちらは、データをGeminiが分析し、テーブル全体の説明や各カラムが何を表しているのかを自動で提案してくれる機能です。Google Cloudが提唱する「Data Agents」構想においてデータガバナンスを担うエージェントの機能の一部と言えます。

説明が整備されることによる2つのメリット

この機能によってテーブルやカラムの説明が整備されると、例えば次のようなメリットが期待できます。

メリット1:データの発見が容易になる

説明が登録されていると、BigQuery Universal Catalog での検索性が向上します。例えば、「映画のレビューデータ」といった自然言語で検索した際に、説明文が適切に設定されているテーブルがヒットしやすくなり、目的のデータを素早く発見できます 。

bquc

メリット2:AIのデータ解釈精度が向上する

BigQueryには、自然言語でSQLを生成するAI機能があります。このとき、カラムの説明が整備されているとAIが各カラムの意味をより正確に理解できるようになり、生成されるSQLの精度が向上します。

以下の例では、

genresカラムに「映画に関連するジャンル一覧」という説明があることで、AIは「ジャンル別に集計すればよい」と正しく解釈できています。

bq_gemini

やってみよう!手順を解説

それでは、実際にこの機能を試してみましょう。

準備:使用するデータセット

今回は、検証用に Movielensという公開データセットの movies テーブルを使用します。このテーブルには、映画のID (movieid)、タイトル (title)、ジャンル (genres) が含まれています。(ちなみに、私はゴッドファーザーシリーズが好きです)

スキーマ

bq_movies_schema

データプレビュー

bq_movies_preview

手順1:分析情報(Insight)を生成する

説明を生成するには、まず対象テーブルの「分析情報(Insight)」を生成する必要があります。BigQueryコンソールでテーブルを開き、「分析情報」タブから「Generate insights for free」をクリックします。

bq_movies_insight

手順2:生成された説明を確認する

分析情報の生成が完了すると、Geminiによって生成されたテーブルとカラムの説明が表示されます。2025年6月25日時点では、説明は英語で生成されます。

bq_movies_insight2

手順3:生成内容を編集して保存する

生成された内容はそのまま保存することも、編集することも可能です。今回は、生成された英語の説明に日本語訳を追記してみます。編集後、「Save」ボタンをクリックすると反映されます。

bq_movies_insight3

手順4:テーブルとスキーマに説明が反映されたことを確認

「詳細」タブと「スキーマ」タブで、説明が正しく反映されていることを確認します。

テーブルの説明

bq_movies_detail

カラムの説明

bq_movies_schema

Gemini が生成した説明が反映されていることが確認できました。これならデータの中身を正確に把握できていなくても、Geminiの力を使って適切な説明を埋めることができそうです。

最後に

本コラムでは、BigQueryの新機能であるGeminiによる説明自動生成機能をご紹介しました。

利用にあたっては、以下の点にご注意ください。

  • 2025年6月25日時点で、この機能はプレビュー版です
  • 説明は英語で生成されます

データガバナンスの負担を軽減する可能性を秘めた楽しみな機能です。ぜひ一度、お試しください。

また、自社に専門人材がいない、リソースが足りない等の課題をお持ちの方に、エンジニア領域の支援サービス(Data Engineer Hub)をご提供しています。
お困りごとございましたら是非お気軽にご相談ください。

》サービスの詳細はこちら

本件に関するお問い合わせは下記にて承ります。
株式会社DataCurrent
info@datacurrent.co.jp

人気のコラムランキング

PICK UP

企業のDX推進におけるダッシュボード内製化について

DXmarketingPICK UP コラムダッシュボード内製化

企業のDX推進に向けた人材教育支援について

GA4marketingPICK UP コラム内製化

【データプライバシーコラム】電気通信事業法改正の解説(2022年7月時点)

CMPPICK UP コラムデータプライバシーデータプライバシーコラム個人情報保護

CMP導入時の注意点

CMPPICK UP コラムデータプライバシーデータプライバシーコラム個人情報保護

TOPへ
戻る