はじめに(翻訳者より)
Arweaveプロジェクトは2017年にICOを行い(その際は「Archain」という名称でした)、以来継続的にコラムやリリースなど情報発信を続けてきています。
それらの情報の大部分が英語で発信されたものであるため、日本人に向け、少しずつ翻訳して紹介していきます(都合上、意訳を多く含みます。文末にリンクを張りますので可能なら原文も確認してみてください)。
研究者のためのPermaweb
2019年4月3日
この記事は、ArweaveのイニシアチブであるDecentralised Public Libraryのゲストブログ記事です。
従来のウェブは、すべての研究者や科学者に新たな機会を豊富に提供してきました。研究募集のための新しい集団へのアクセスから、はるかに多くの聴衆への研究成果の配布まで、ウェブは知識の発見と交換を爆発的に増加させる触媒となった。
しかし、今日、ウェブの引用やオンライン出版物の共有、引用、保存に用いている方法には、いくつかの重大な問題がある。そして、これらの欠陥は、私たち自身の研究の信頼性、再現性、将来的な価値を制限しているのです。
ここでは、permaweb、特にArweaveウェブ拡張機能を用いて、これらの問題を解決する方法を探っていきます。
問題点:リンク切れとソースの紛失
研究においてウェブソースを引用する場合、私たちは通常、単にURL(「ユニーク・リソース・ロケーター」)を使ってコンテンツにリンクします。そしてURLは、引用した文献の場所をウェブブラウザに指し示すだけです。
しかし、従来のウェブリンクは真に永続的なものではなく、驚くほどの速さで消失したり変更されたりすることがあり、そうなると、引用した証拠や研究を再び見つけるのは非常に困難か、不可能にさえなってしまいます。
リンクが「切れ」て、もはやアクティブなウェブページを指していない場合、これは「リンク切れ」として知られています。このような場合、BBCの以下のような「404エラー」が表示されることが多く、ドメイン全体が消滅している場合は、ブラウザによっては、このような表示がされることがあります。
リンク切れは驚くほど多く、最も権威のある研究機関でさえ影響を受けています。実際、学術論文の70%には、リンク切れを起こした参考文献が含まれているのです。
あなたの研究は時代を超越していますが、あなたのウェブ引用はそうではありません。20年後に機能し続けるウェブリンクは、わずか1.6%です。
リンク切れの原因は様々で、組織が新しいドメイン名に移動したり、サイトマップを再構築したり、ページを削除したりすることがあります。このブログでは、これらの理由のいくつかをより深く掘り下げています。
ご存知のように、過去の調査は将来の調査の基礎となります。
もし、今後数年、数十年の間に、引用や言及の大部分が減少したら、将来の世代の科学者や研究者は、どのようにして「巨人の肩の上に立つ」ことができるでしょうか?
解決策 パーマウェブリンクを使用する
permawebは、リンク切れの解決策を提供するために設計されています。Arweaveウェブ拡張機能を使用することで、アーカイブされたすべてのページには、決して変わることのない、真にユニークで永久的な識別子が自動的に付与されます。
つまり、リンク切れにさよならを言うことができるのです。
以下は、ユニークな識別子を持つpermawebのリンクの例です:
https://arweave.net/saYqBP_aEVTlpc62xaCOtWgmVKPdQe566Z5Wiz_kRFs
確かに、arweave.netのリンクも腐ってしまうのではと思われるかもしれません。その通りです。
arweave.netのドメインは、遠い未来のある日、本当にアクセスできなくなるかもしれません。
何らかの理由でホスティングを停止したり、インターネットプロバイダや政府がアクセスを制限するかもしれません。しかし大丈夫です。誰でも新しい「ゲートウェイ」ドメインを設定し、まったく同じ一意の識別子(この例では「saYqBP_aEVTlpc62xaCOtWgmVKPdQe566Z5Wiz_kRFs」)を使って、まったく同じコンテンツにアクセスすることができるのですから。
つまり、これらの識別子は、Arweaveプロジェクトそのものよりも無期限に長持ちするのです。最終的に、これはコンテンツの寿命を大幅に延ばし、私たちだけでなく、私たちの子供や孫の代まで、リンク切れを解決することになります。
問題点:コンテンツの流失とウェブページの変化
「リンク切れ」と同様に、従来のウェブ上のリンクは「コンテンツ・ドリフト」にも悩まされることがあります。
コンテンツドリフトは、リンク切れとは微妙に異なりますが、どちらも深刻な悪影響を及ぼします。リンク切れでは、元のURLはもはやまったく機能しませんが、コンテンツドリフトでは、URLはまだ機能しているウェブページにユーザーを導きますが、コンテンツは最初に引用されたときから大幅に変更されています。
学術論文のウェブリンクの75%は、コンテンツドリフトに悩まされています。
ウェブページのコンテンツが信頼できず、変更される理由は数多くあります。ニュース速報の記事に提供された無害なアップデートから、ステルス編集というもっと邪悪な現象まで、さまざまな理由があります。
すべての学術研究と同様に、あなたの出版物は、あなたの研究に透明性と正当性を与えるために、正確で信頼性の高い引用に依存しています - permawebはこれを支援することができます。
解決策 ページのパーマウェブスナップショット
Arweaveウェブ拡張機能を使ってページをpermawebにアーカイブすると、基本的にアーカイブした時点のページのコンテンツのスナップショットを凍結して、永久に保存します。つまり、ページが失われたり、内容が微妙に(あるいは劇的に!)変化したり、削除されたりすることを心配する必要がないのです。
あなたのリファレンスは、アーカイブしたときのまま、永久にパーマウェブ上に残ります。リンク切れの場合と同様、パーマウェブは、コンテンツ・ドリフトに対する真の解決策を提供し、信頼することができます。
ウェブページやPDFがパーマアーカイブされると、変更、編集、その他の改ざんができなくなります。これにより、重要なリファレンスにさらなる自信と信頼性を与えることができます。
昨日アーカイブされたページも、1年前にアーカイブされたページも、現在見ているものがアーカイブされたときと同じであることは、数学的な確信を持って知ることができるのです。
問題点:バックアップの維持
証拠や調査のためにウェブを探し回るとき、時間のかかる課題の1つは、その証拠を保存し、整理する効率的な方法を見つけることです。
確かに、従来の無常なウェブからURLのリストを保存することはできますが、私たちが示したように、それらはいずれリンク切れやコンテンツの漂流に悩まされることになります。
あるいは、多くの人が物理的なコピーを印刷したり、ブラウザに組み込まれた「PDFに印刷」機能を使ったりしていることでしょう。これらのコピーはどこかに保存しなければなりませんが、特に物理的なコピーの場合、非常に不便です(そして安全でもありません)。
解決策 自動化された永久バックアップの数々
permawebでは、標準で約150個の自動バックアップを提供しており、この数は何年も、何十年も、何世代も先の未来まで、着実に増えていくことを想定しています。簡単に言うと、これは自分でバックアップを維持する心配がないことを意味します。
パーマウェブは、あなたのバックアップの複製を、追加費用なしで、自動的にどんどん増やしていきます。
もしあなたが自分でパーマアーカイブを試してみたいなら、こちらの非常に初心者向けのガイドのステップに従うことで、無料で行うことができます。
つまり、パーマウェブはあらゆる研究者にとって非常に強力なツールなのです。あなたの研究を永久にバックアップするために、本当に永久的なリンクと重要なウェブ引用のスナップショットを提供することによって、パーマウェブは、将来の世代があなたの重要な研究から学ぶことを可能にするのです。