僕たちのサイト「水環境分析ビジネスハブ」が目指しているのは、データサイエンスやAIみたいなテクノロジーの力を使って、深刻化する水環境の問題にみんなで立ち向かって
僕たちのサイト「水環境分析ビジネスハブ」が目指しているのは、データサイエンスやAIみたいなテクノロジーの力を使って、深刻化する水環境の問題にみんなで立ち向かっていこう、っていうことです。専門家だけじゃなくて、企業や行政、それに市民も巻き込んで、それぞれの知見やデータを持ち寄ることで、これまで見えなかった解決策が見つかるんじゃないかって、本気で信じてるんですよね。この「共創」の考え方が、活動の根っこにある一番大事な部分だと思ってます。最近、この流れを加速させるキーとして僕が特に注目しているのが、「オープンデータ」と、それを誰もが活用できる「共有プラットフォーム」の可能性なんです。これって、水環境問題の解決に向けたアプローチを根本から変える、まさにゲームチェンジャーになるんじゃないかなって、すごくワクワクしてるんですよ。
ポイント1
昔は、環境データって言ったら、一部の研究機関や行政が持ってる専門的で、ちょっと近寄りがたいイメージがありましたよね。でも今、時代は大きく変わってきています。例えば、日本の国土交通省は「水文水質データベース」で全国の河川の水質データを公開していますし、環境省も「水環境総合情報サイト」で様々なデータを提供してくれています。こういうオープンデータを使えば、僕たちみたいな学生や、データ分析に興味があるエンジニアでも、地元の川の水質がこの10年でどう変わったか、なんてことを自分の手で分析できるんです。Pythonといくつかのライブラリがあれば、公開されているCSVデータをダウンロードしてきて、特定の化学物質の濃度推移をグラフにするなんて、本当にあっという間にできちゃいます。
```python import pandas as pd import matplotlib.pyplot as plt import matplotlib.font_manager as fm
# 日本語フォントの設定(ご自身の環境に合わせてフォントパスを指定してください) # 例: IPAゴシック # font_path = '/usr/share/fonts/opentype/ipafont-gothic/ipagp.ttf' # font_prop = fm.FontProperties(fname=font_path) # plt.rcParams['font.family'] = font_prop.get_name()
ポイント2
# 国交省の水文水質データベースからダウンロードしたCSVを想定 # sample_data.csv の中身はこんな感じ # 観測所名,採取年月日,COD(mg/L) # 地点A,2022/4/1,2.5 # 地点A,2022/5/1,2.8 # ...
# データの読み込み # df = pd.read_csv('sample_data.csv', encoding='shift-jis') # df['採取年月日'] = pd.to_datetime(df['採取年月日']) # df = df.set_index('採取年月日')
# サンプルデータフレームを作成してデモ data = { '採取年月日': pd.to_datetime(['2023-01-01', '2023-02-01', '2023-03-01', '2023-04-01', '2023-05-01']), 'COD(mg/L)': [2.1, 2.5, 2.3, 2.8, 3.1] } df = pd.DataFrame(data).set_index('採取年月日')
ポイント3
# データの可視化 plt.figure(figsize=(10, 6)) plt.plot(df.index, df['COD(mg/L)'], marker='o', linestyle='-') plt.title('某河川地点におけるCODの月次推移(サンプルデータ)', fontproperties=font_prop) plt.xlabel('日付', fontproperties=font_prop) plt.ylabel('COD (mg/L)', fontproperties=font_prop) plt.grid(True) plt.show()
``` こんな風に、ほんの数行のコードでデータが「見える」ようになる。この一歩が、問題への関心をぐっと深めてくれるんですよね。
ただ、データがネットのあちこちに点在しているだけだと、それを見つけてきて、使える形に整える「データの前処理」っていう作業が結構大変だったりします。それぞれのデータの形式もバラバラだったりしますしね。そこで、僕たちが今まさに力を入れているデータ分析プラットフォームのような「場」がめちゃくちゃ重要になってくるんです。様々なソースから集めた水環境データを統合して、誰もがWebブラウザ上で直感的に地図と重ね合わせたり、グラフを作ったり、さらには簡単な分析モデルを試せたりする。そんな環境があれば、専門家じゃない人でも気軽にデータに触れて、自分なりの発見や疑問を持つことができるようになります。例えば、下のOur World in Dataのグラフみたいに、複雑なデータも可視化されると一気に理解が進みますよね。僕たちのプラットフォームも、こういう分かりやすさを目指したいんです。
ポイント4
 (出典: Our World in Data, "Plastic waste inputs from rivers into the ocean")
結局のところ、データやプラットフォームは、あくまで問題解決のための「道具」でしかありません。本当に大事なのは、その道具を使って、僕たち一人ひとりが何を考え、どう行動するか。このブログを読んでくれた学生さんやエンジニアの方が、「ちょっと面白そうだから、自分も近所の川のデータを調べてみようかな」って思ってくれたら、それ以上に嬉しいことはないです。僕もこのハブの一員として、データを通じて水環境の未来を少しでも良くしていく、そんな大きな流れを皆さんと一緒に作っていきたい。もし興味が湧いたら、ぜひ声をかけてください。一緒に面白いこと、やりましょうよ!