この舞台裏の記事は、National Science Foundationとの提携によりLiveScienceに提供されました。
お奨めは、Cubbiesが大好きです。彼らのおかげで、米国最高裁判所のオーディオ録音のデータベースが一般に無料で利用できるようになりました。ストレッチが多すぎますか?ツールがシカゴカブス、テクノロジー、法律の研究に対する1人の愛から生まれたからではありません。
20年前のリグレーフィールドでの晴れた日の午後、当時ノースウェスタン大学の政治学教授だったジェリーゴールドマンは、2人の学生とゲームを楽しんでいる観客席に座っていました。彼らは、野球が米国最高裁判所の隠喩である方法を考えました:9人の選手、9人の正義。 1つのゲームで素晴らしいピッチとすばらしいキャッチが実現します。口頭弁論と思慮深い判決に関するもう1つ。
ゴールドマンが選手のキャリアに関する重要な詳細を野球カードで説明したとしたら、ゴールドマンは考えた。初期のAppleコンピュータ用のアプリケーションおよびプログラミングツールであるHyperCardの登場を考えると、このプロジェクトは達成可能であるように思われました。 「私の同僚は私がクレイジーだと思っていました」と、現在イリノイ工科大学(IIT)シカゴ-ケントカレッジオブローの教授であるゴールドマンは言います。 「しかし、情報技術が世界の働き方を変えると信じていました。」
ゴールドマンの「最高裁判所を本当に人間らしくする」という探求は、NSFが資金提供するOyezプロジェクトの開発につながりました。これは、1955年以来裁判所が聞いた口頭弁論の検索可能な山を含むマルチメディアアーカイブです。今 もご利用いただけます。
「主な目的は、高貴な地位から裁判所を降ろして、それを公衆にもたらすことでした」とゴールドマンは言います。 「また、裁判所に関連する膨大な量のデータを利用できるようにしたかったのです。」
検索可能なオーディオとビデオの作成
最高裁判所に命を吹き込むために、ゴールドマンはまず裁判所のオーディオファイルを保管する国立公文書館を説得し、テープをコピーしてデジタル化するためにテープをコピーすることを許可しました。新しくデジタル化されたオーディオテープを検索可能にするために、ゴールドマンはペンシルベニア大学の計算言語学教授であるマークリバーマンと共同で作業しました。 Libermanは、オーディオテープの音声を筆記録と照合できるアルゴリズムを採用しました。この作業は最終的に、現在、一般的に使用されている話し言葉の音を文章に合わせるために使用されるツールであるPenn Forced Alignerの開発につながりました。
「私たちは本質的に、オーディオとビデオのレコーディングのためにGoogleのような検索エンジンを作りました」と、学者や一般市民に対するアーカイブズの価値のためにこの仕事に引き付けられたリーバーマンは言います。彼はまた、無数のソースから入手可能なオーディオおよびビデオのレコーディングの増加するコレクションに適用可能な検索技術を作成する機会を歓迎しました。
「eは、費用対効果の高い方法で検索にアプローチする方法のモデルを設定できました。これは大規模なプロジェクトのように思えるかもしれませんが、現在オンラインで利用できるものや将来的には何ができるかと比べると小さいものです」とリベルマン氏は言います。
(最近、オックスフォード大学と大英図書館のリベルマンの同僚は、整列ツールを使用して、Sonyウォークマンでスピーチを録音した参加者から集められた1億語の話された部分を含むアーカイブである大英国立コーパスの録音を解読しました。)
データの分析
次に、ゴールドマンは最高裁判所からの口頭弁論のほぼ14,000時間の音声を分析しました。 「データセットについて尋ねることができる無数の質問があります」と彼は言います。 「しかし、複数の話者がいて自然発生的なため、これは珍しいデータセットです。」最初のタスクの1つは、各口頭弁論で各話者を識別することでした。約11人の話者が議論に関与する可能性があるため、課題です。さらに、何年もの間、筆記録は質問に正義の名前を付けませんでした。
これらの課題に取り組む間、ゴールドマンと彼の共同研究者-カーネギーメロン大学とミネソタ大学の同僚を含めて-は、1955年以来の裁判所の活動について多くの興味深い事実をまとめました。
- 58年間で32人の裁判官
- 8,600人の支持者、そのうち70%が一度だけ法廷に出廷
- 6,600万語を話しました
- 6,100件を超える訴訟と2,300件を超える意見発表
- 最長の議論-1300分
- 最短の議論-14分
法廷で27年間務めた正義のAntonin Scaliaは7,200分で最もおしゃべりな記録を保持し、23.5年を務めたFelix Frankfurterは7,000分と迫っています。最も拘束された正義は、シャーマンミントンとクラレンストーマスです。ミントンは7年間法廷に出廷したが、彼の最後の年だけが記録に残っている。彼の最後の任期中、彼はたった17分間聞こえます。トーマスは1991年以来法廷にいて、23分に出勤します。
Oyezプロジェクトは法学者に豊富な資料を提供する一方で、言語学研究者はさまざまな研究の記録を分析します。
民衆に法廷をとる
国民や学者がデータを簡単に調査できるように、ゴールドマンのチームは引き続き改良を加え、インターフェースを開発しています。 2013年秋には、データシステムに検索機能が追加され、ユーザーが資料をより深く掘り下げることができるようになります。たとえば、この新しい検索機能により、ユーザーは「厳密な調査」という用語で検索し、文字起こしでそれを確認し、それを聞いて、リスナーがやりたいことを何でもできるようになります」とゴールドマン氏は説明します。
シカゴ人は、「少しも計画を立てないで」と言うのが好きです。ゴールドマンはこの声明に忠実です。彼は最高裁判所プロジェクトで開発されたツールをすべての米国上訴裁判所に適用したいと考えています。計画は、Webサイトとモバイルデバイスアプリケーションを開発することです。最近、Knight Foundationはカリフォルニア州、フロリダ州、イリノイ州、ニューヨーク州、テキサス州の州最高裁判所でこの作業を行うためにOyezプロジェクトに60万ドルを授与しました。
「アプリは最もクールな部分です」とゴールドマンは言います。彼らはISCOTUSの設計に従います今これは、ゴールドマンとキャロラインシャピロ(IITシカゴ-ケントカレッジオブロー)教授の共同研究によるものです。 ISCOTUS今 現在の最高裁判所の書類のすべてへのアクセスを提供し、音声と筆記録が含まれています。シンプルなモーションで、ユーザーはトランスクリプトをめくって検索し、セクションを同僚と共有できます。 "最良の部分?"ゴールドマンは言う。 「この情報はすべて無料です。」
Oyezプロジェクトの規模は、ゴールドマンが想像もしなかった規模でした。 「NSFのサポートがなければ、私たちはまだ苦労しています」と彼は言います。 「NSFの支援のおかげで、私は少し考えてみる勇気がありました。」
編集者注: Behind the Scenesの記事に描かれている研究者は、 国立科学財団、連邦政府機関は、科学と工学のすべての分野にわたる基本的な研究と教育への資金提供を担当しています。この資料に記載されている意見、調査結果、結論または推奨事項は著者のものであり、必ずしも全米科学財団の見解を反映するものではありません。を参照してください 舞台裏のアーカイブ.