見出し画像

【新連載】今さら人に聞けない、そもそもWebって何?―『Web3とは何か』by岡嶋裕史 prologue2

初回はこちら。
岡嶋裕史さんの新書最新刊。発売一月で4刷になりました。

今さら人に聞けない、そもそもWebって何?―『Web3とは何か』by岡嶋裕史 prologue2

Webの理解とその歴史①

それにしてもWeb3とは不思議な言い方だ。ブロックチェーンもNFTもWebとはかなり遠い距離にある技術なのに。

この辺は説明が必要だろう。なるべく短めに解説する。インターネットとWebの関係である。わかっている人にはうざったいだけの話なので、ここは読み飛ばしてほしい。

インターネットは「世界中を結ぶ例のアレ」である。インターネットの中核技術であるIP(Internet Protocol)は、名前の通りネットワークとネットワークの間をどうつなぐかを記した規格であり、それに準拠して作られた製品だ。だから、inter-net(ネットとネットの間)と呼ぶのである。

ここで言うネットワークとは、「特に宛先を指定せず、全員宛てに送信しちゃうぞ」という通信のやり方が許される範囲のことで、一般的には部屋やフロア、建屋などが該当する。最初期のネット環境は部屋の中だけ、フロアの中だけで通信ができるものだったのだ。

でも、それでは不便である。隣の部屋や建物と通信したい。それならネットワークを大きくすればいいのだが、1つのネットワークの中に多数の利用者を収めると通信が混雑するなど、デメリットがきついのである。ネットワークはあまり大きくできないのだ。

そこでネットワークのサイズは小さいまま、ネットワーク同士を結ぶ発想になる。その結び方がIPであり、IPに準拠して作られた製品であれば異なるネットワークと相互通信ができる。

IPのルールにしたがって、ネットワークとネットワークを結ぶ代表的な機器がルータである。家庭用のルータをお持ちの方も多いと思う。あれは、自宅というネットと、通信事業者(プロバイダ)というネットを結ぶ役割を果たしている。

ネットとネットを相互接続して通信できる範囲を拡大すると抜群に便利になったので、世界中のあらゆる箇所でそれが行われた。結果出来上がったのが、いまの意味でのインターネット(The Internet)である。インターネットは細かいネットワークが相互接続に相互接続を繰り返して組み上げられたネットワークの集合体で、そこには特に管理者もおらずバケツリレーのような通信で世界をつないでいる。

よく言われることだが、インターネットは土管や高速道路のようなものである。それ自体で面白いものではない。私はネットワークが好きで勉強していたので、インターネットにつないで空パケットを送り出しただけで興奮するが、まっとうな生活を送っている人はそんなことは何も面白くないだろう。

道路があるだけではいまいち便利ではなく、宅配便が現れることで劇的にQoLが向上するように、マニアの遊び場であったインターネットが一般に普及するにはWebの登場を待たねばならなかった。

Webとは

Webとはホームページを読むアレのことだ。WebはCERN(欧州原子核研究機構)で産声を上げた。なぜ原子核とホームページのセットなのだと理解に苦しむかもしれないが、大量のドキュメントを読み書きするニーズがあるからだ。

高度な工業製品を扱う場では数百万から数千万ぺージのマニュアルが配布されることがある。もはやページ数より、トン数で計った方がよいレベルである。半端ではなく重く、操りにくい。しかも技術マニュアルなどというものは数行読むごとに、「応用編の123ページを参照せよ」、「発展編の45ページを読め」といった指示が出てくる。快適な読書体験とは言いがたい。

それをデジタル化するのは自然な発想で、どうせなら単に電子化するだけでなく、「応用編を参照したい」、「ここで言及されていることについて、参考画像を見たい」ときにクリック一発でそこに行けるようにしよう(ハイパーリンク)と付け加えたのはデジタルトランスフォーメーション(DX)の非常によい成功例である。

今までやりたかったけれども道具や組織の問題でできなかったことが、デジタル技術の導入によってできるようになることがDXである。問題解決の手法にデジタル技術を加えることで選択肢を広げ、やれることが増えるのがその本質だ。単にその技術を導入しただけではDXではないし、紙の作業をそのままデジタルに移行すれば、むしろ不便なことも出てくるだろう。同じ失敗を私たちはOA化、情報化、IT化と、名前を変えて何回も繰り返してきた。

現時点では電子書籍が広く社会に受け入れられていて、愛用されている方も多いと思うが、中身をのぞくと使われている技術はほぼWebと一緒である。それは当たり前と言えば当たり前のことで、いまのWebはちょっと別の方向や広い範囲で利用できるように進化したが、その出発点はドキュメントを楽に読み解くための技術だったからだ。

3つの中核技術

Webには中核技術であると考えられているものが3つある。HTML、HTTP、URIだ。

HTMLはWebページを記述するための言語である。本書では私たちがWebでふだん見ている例のアレを、Webページと呼ぶことで統一する。現在ではほぼ同じ意味でホームページやWebサイトが使われているが、ホームページはもともとはWebページを見るためのソフトウェア(ブラウザ)を起動させたときに最初に出てくるWebページか、もしくはあるWebサイトを見たときのトップページ(特に何も指定しないと最初に出てくる、総合案内的なやつ)を指す用語である。Webサイトはある組織がもつWebページの総体のことだ。

Webページは「メモ帳」で作った文書(プレーンテキスト)のように、シンプルに文字だけが羅列されているわけではない。この文字はでかい、この数字は赤い、この部分に写真が入って、ここをクリックすると光文社のWebページに飛ぶ、といったしかけが施されている。

HTMLではこのしかけ部分をタグと呼ばれるメタ情報を記述することで実現している。メタ情報とは一段階上の視点からの情報である。私はこれを台本になぞらえて説明するのが好きだ。

 「オタクがクラスの運営にくちばしを挟むのか?」
 ――思いっきり蔑んだ感じで言ってあげてください

以前にあるオーディオドラマ向けに実際に書いた原稿から引用してきた。一般的に、台本において情報は二種類に区別することができる。セリフとト書きである。セリフはまさに演者がしゃべる内容であり、ト書きはどう演じるかを補足する内容である。別の言い方をすれば、セリフはお客が耳にする情報だが、ト書きはそうではない。

HTMLでも同じことをする。

<title>光文社ホームページ</title>
<font color="red">ようこそ!</font>

地の文として書かれている「光文社ホームページ」や「ようこそ!」がブラウザに表示される情報で、<>で囲まれた部分がそれをどう取り扱うかを示すメタ情報である。

この場合、「光文社ホームページ」はtitleだと指定されているので、これを読み込んだブラウザは一般の表示部分ではなく、タイトルバーと呼ばれるウィンドウの上部に「光文社ホームページ」と表示する。「ようこそ!」については、字の色を赤くして表示する。

ハイパーリンクや画像の埋め込みなども、同様にメタ情報によって制御されている。これは単に見た目の調整をするだけではなく、むしろ文章構造を表すことがそもそもの目的だ。「ここは見出し」、「ここは重要事項」とやっておけばWebページをそのまま書籍化する場合などに自動的に章立てや太字化を行うことができる。

自分が見ているWebページが実際にHTMLとしてどのように書かれているかは、たとえばChromeならF12キーを押すと見ることができるので、時間があるときに試してみるといいと思う。

HTTPはHTMLによって書かれたWebページを送受信するための通信手順である。みんながこれに従っているので、別のメーカーのパソコンでも、パソコンとスマホの間でもWebページをやり取りすることができる。

Webページの配布形態には特にしばりはないので、スマホにWebページを置いてそれをパソコンから見てもいいし、自分のパソコンにWebページを置いてそれを同じパソコン上で読んでもいい。

しかし、一般的にはサーバ(サービスする側のコンピュータ)、クライアント(サービスを受ける側のコンピュータ)に役割分担して、配布したり読んだりすることがほとんどだ。一台のコンピュータで何でもかんでも処理する形態ではないので、これを分散型コンピューティングと呼ぶ。

よくWeb3が分散型と言われるけれども、それは権力が分散している(サーバが偉くて資源が集中していて、クライアントはそこにお願いして情報を取りに行くといった関係ではなく、すべての機器が平等(P2P:Peer to Peer)である)ことや、集中管理機構がないことを指している。従来型のクライアント/サーバシステムも分散型ではあるのだ。

私たちはふだんクライアントとしてサーバにWebページを要求し、見せてもらっている。よくWebページが見つからなかったときに、「404 Not Found」と表示が返ってくることがある。これもHTTPで決めていることだ。
サーバにWebページを要求したけれども、なかったので404と返事が返ってきたのである。

数字の意味は事細かに決まっているが、ざっくり説明すると100番台だと「いまやってます」、200番台だと「うまくいきました」、300番台だと「追加の手続きが必要です」、400番台だと「あんたのせいでうまくいかない」、500番台だと「こちらのせいでうまくいかない」の意味になる。

404エラーで一番多い原因は、そのWebページを作った人が消したか移動したかすることなので、自分のせいにされるのはいまいち納得がいかないが、「アドレスを間違えたんでしょ」と疑われているわけである。

URIは「このWebページが見たい」ときに、「この」を指定するのに使う。URIは多くの人にとって聞きなれない用語だと思う。URIはURLとURNに分けることができ、さらには紛らわしいので全部URLに統一しようという動きもあって混乱している。

URLはある情報にアクセスするとき、場所によってその情報を特定するやり方だ。

https://www.kobunsha.com/index.htm

こう書いてあったら、私企業(com)に分類(ドメイン)される、光文社(kobunsha)内にある、wwwと名前のついたコンピュータに保存されている、index.htmというWebページに、httpsという手段でアクセスしたい、の意味である。httpsとはhttpに暗号化と認証の機能を加えて安全な通信手段にしたものだ。

いっぽうのURNは、名前によって情報を特定する。たとえば、書籍につけるコードであるISBNはURNである。これは場所に頓着していない。同じ本が東京と沖縄の書店にあったとして、近い方で買えればいいからだ。

このHTML、HTTP、URIと、それを取り巻くWebサーバソフト、Webクライアントソフト(ブラウザ)などの発展・普及によりWebは隆盛を迎えた。多くの企業がWebサイトを立ち上げて情報発信にいそしんだ。これがWeb1.0(当時はそんな呼び方はなかったが、Web2.0が登場したときに、さかのぼってそう呼ばれた)である。(続く)


光文社新書ではTwitterで毎日情報を発信しています。ぜひフォローしてみてください!