ラージハドロンコライダー(LHC)が人類がこれまでに実施した最大かつ最も高価な物理学実験になることはすでにわかっています。以前は想像もできないエネルギー(10年の終わりまでに14 TeVマークまで)で相対論的粒子を衝突させると、何百万もの粒子(既知であり、まだ発見されていない)が生成され、巨大粒子検出器で追跡および特徴付けする必要があります。この歴史的な実験では、大量のデータ収集と保存の作業が必要になり、データ処理のルールを書き直す必要があります。 5秒ごとに、LHCの衝突によりDVD相当のデータが生成されます。これは、1ギガバイト/秒のデータ生成レートです。これを展望するために、非常に良好な接続を備えた平均的な家庭用コンピューターは、毎秒1メガバイトまたは2メガバイトの速度でデータをダウンロードできる可能性があります(非常に運が良ければ、500キロバイト/秒になります)。したがって、LHCエンジニアは、保存および配布できる新しい種類のデータ処理方法を設計しました ペタバイト (百万ギガバイト)世界中のLHC協力者へのデータのダウンロード(ダウンロードを待つ間、古くて灰色になることはありません)。
1990年、欧州核研究機構(CERN)は私たちの生活に革命をもたらしました。昨年、CERNの物理学者であるTim Berners-Leeが電子情報管理の提案を書きました。彼は、「ハイパーテキスト」と呼ばれるものを使用して、インターネット上で情報を簡単に転送できるという考えを提唱しました。時間が経つにつれ、Berners-Leeと共同作業者であるCERNのシステムエンジニアであるRobert Cailliauは、単一の情報ネットワークを組み合わせて、CERNの科学者が共同作業を行い、面倒なストレージデバイスに情報を保存することなく、個人のコンピューターから情報を共有できるようにしました。ハイパーテキストにより、ユーザーはWebページを介してテキストを閲覧および共有できます。 ハイパーリンク。その後、Berners-Leeはブラウザエディタの作成に進み、すぐにこの新しい形式の通信が膨大な数の人々で共有できることに気づきました。 1990年5月までに、CERNの科学者はこの新しい共同ネットワークを ワールドワイドウェブ。実際、CERNは世界初のウェブサイトhttp://info.cern.ch/の責任者であり、このサイトがどのようになっていたかの初期の例は、World Wide Web Consortiumのウェブサイトで見つけることができます。
したがって、CERNはインターネットを介したデータの管理に慣れていますが、新しいLHCには特別な扱いが必要になります。 Georgia Institute of TechnologyのハイパフォーマンスコンピューティングのエグゼクティブディレクターであるDavid Baderが強調しているように、インターネットで許可されている現在の帯域幅は大きなボトルネックであり、他の形式のデータ共有がより望ましいものになっています。 「LHCとそれが将来何をしているかを見てみると、Webができなかったことの1つは、驚異的な豊富なデータを管理することです」と彼は言いました。つまり、テラバイトのハードドライブに大きなデータセットを保存して、投稿で共同編集者に送る方が簡単です。 CERNは、World Wide Webでのデータ共有の協調的な性質に対処しましたが、LHCが生成するデータは、現在利用可能な小さな帯域幅を簡単に過負荷にします。
これが、LHCコンピューティンググリッドが設計された理由です。グリッドは、最初の(ティア0)は、スイスのジュネーブ近くのCERNにあります。ティア0は、LHCによって送り出された生データ(バイナリコードの1および0)を即座に保存および管理するように設定された100,000の高度なCPUを含む巨大な並列コンピューターネットワークで構成されます。この時点で注目に値するのは、すべての粒子衝突がセンサーによって検出されるわけではなく、ごくわずかな部分しかキャプチャできないことです。比較的少数の粒子しか検出されないかもしれませんが、これは依然として巨大な出力に変換されます。
Tier 0は、出力されたデータの一部を、専用の10ギガビット/秒の光ファイバー回線を介して11にブラストすることで管理します。 Tier 1 北米、アジア、ヨーロッパのサイト。これにより、ニューヨークのブルックヘブン国立研究所にある相対論的重イオン衝突(RHIC)などの共同研究者が、ALICE実験のデータを分析し、LHC鉛イオン衝突の結果と独自の重イオン衝突結果を比較できます。
Tier 1インターナショナルコンピューターから、データセットがパッケージ化され、140に送信されます ティア2 世界中の大学、研究所、民間企業にあるコンピュータネットワーク。この時点で、科学者はデータセットにアクセスして、生のバイナリコードから粒子のエネルギーと軌道に関する使用可能な情報への変換を実行します。
階層システムはすべて問題なく機能しますが、「ミドルウェア」と呼ばれる非常に効率的なタイプのソフトウェアなしでは機能しません。データにアクセスしようとするとき、ユーザーはペタバイト級のデータ全体に、さまざまな形式でさまざまなサーバーに分散した情報を必要とする場合があります。と呼ばれるオープンソースのミドルウェアプラットフォーム Globus 必要な情報をシームレスに収集するという大きな責任を負うことになります。その情報が研究者のコンピュータ内にすでに存在しているかのようです。
LHCプロジェクトを超えて拡張できるのは、階層システム、高速接続、独創的なソフトウェアのこの組み合わせです。すべてが「オンデマンド」になりつつある世界で、この種のテクノロジーはインターネットを トランスペアレント エンドユーザーに。惑星の反対側での実験によって生成されたデータから、ダウンロードの進行状況バーを待たずに高解像度の映画を視聴することまで、すべてに瞬時にアクセスできます。 Berners-LeeによるHTMLの発明と同様に、LHCコンピューティンググリッドはインターネットの使用方法に革命を起こすかもしれません。
出典:Scientific American、CERN