森田:観測データは全ての研究成果の源になる重要なもの。責任重大です!! 中村:ALMAによる新しい発見に期待してます。 パンタ:ユーザーポータルの最大活用お待ちしております! (写真右から中村・森田・パンタ)

23. ALMAを支えるデータ・アーカイブ、チリとのネットワーク、ユーザーポータル

(国立天文台ニュース 2013年1月号掲載)

図1. アーカイブ・システムの全体像。チリを拠点として日米欧の地域センターがネットワークで結ばれている。

ALMA望遠鏡で観測されたデータは、世界中の研究者に迅速に提供できるように、逐次ネットワーク経由で日米欧の各地域センターのデータ・アーカイブに送信されます。データ・アーカイブに蓄積された観測データは、ユーザーポータルというWebサイトを通じて研究者に提供されます。

データ・アーカイブ
山頂施設(AOS)のアンテナから送られてきた観測データは、山麓施設(OSF)のアーカイブ①に保存された後、ネットワーク経由でサンチャゴ中央事務所(SCO)のアーカイブ②にコピーされ、そこを拠点として日米欧の各地域センターのアーカイブ③にコピーされます(図1)。データがアーカイブされる際は、観測プロジェクトの内容や観測データのメタ情報等はリレーショナルデータベース(RDBMS)に、バイナリ形式の観測データはヨーロッパ南天天文台(ESO)が開発したファイル管理システムNGAS(Next Generation Archive Management System)に保存されます。日本では、これらのサーバーは国立天文台三鷹にある東アジア地域センター(EA-ARC=East-Asian ALMA Regional Center)の計算機室で運用・管理され(図2)、ユーザーポータルを通して研究者へ提供されます。現在は初期観測のためデータ量はそれほど大きくはありませんが、66台すべてのアンテナを使用した観測が始まると、1日のデータ量はおよそ500GB、1年では200TBにもなるため、どんどん増加するデータを格納するために毎年ストレージを追加していく必要があります。日々のメンテナンスに加え、データ量が増えてもパフォーマンスが低下しないようにチューニングすることは簡単ではありませんが、とてもやりがいがあり、また腕の見せ所でもあります。

図2. 国立天文台三鷹のALMA棟に設置されたコンピュータ。

チリとのネットワーク
デジタルカメラの解像度が高くなると保存される写真のサイズが大きくなるように、高性能なALMA望遠鏡が観測によって生成するデータ量は膨大なものとなります。これをほぼ地球の真裏のチリから転送してこなければなりません。日本、米欧にある3つのARCの中でも、距離的には日本が最も不利な場所にあり、小さなデータの往復にも約0.3秒から0.5秒かかります。

こうした状況にもかかわらず、これまでのところ日本は大きなトラブルもなく、データ転送を継続しています。しかもかなり安価に。これは、SINETをはじめとする既存の学術ネットワークを活用させていただいているおかげです。専用線を使わず、経路の定まらないインターネットを使用していると様々なトラブルに遭遇することもありますが、合同アルマオフィス(JAO)の協力と優秀な国立天文台のスタッフのおかげで、今日も順調にチリから貴重な観測データが届いています。

ユーザーポータル
ユーザーポータルは上記の各ARCで運用されているウェブサービスで、ALMAが提供するサービスへの入口の役割をしています(図3)。実は、ALMAユーザは観測プロジェクトのプロポーザル作成する段階からユーザーポータルとかかわりがあり、専用のサービスを使ってプロジェクトの進捗状況確認、観測終了後もアーカイブデータ参照、ダウンロード等、長く付き合います。

各ARCでローカルニュースの一部以外はまったく同じLook and Feelのポータルが運用されています。ユーザはポータルでALMAの観測スケジュール、各種ニュースのアナウンスはもちろん、観測プロポーザル作成用のツール(OT=Observation Tool)、科学評価観測のデータ、各種シミュレーションツール等のダウンロードもできます。2012年12月にはアーカイブデータの検索とダウンロードが可能になります。そのほか、一括ログイン(SSO=Single Sign On)機能が採用されていて、ポータルに一度ログインすると認証を必要とするALMAのほかのサービスに再度ログインしなくても入れるので便利です。EA-ARCのユーザーポータルに、ぜひアクセスしてみてください!

図3. 東アジアARCのユーザーポータル。

※ 人物の所属や肩書き、組織の名称等は、執筆当時のものです。