意味なきところに意味を見出すという技術

最近、SemanticWebという言葉に魅せられている。

SemanticWebというのは、僕なり解釈すると、情報にコンピュータが処理するために必要なメタデータを付与し、コンピュータによって自動的に情報を収集、整理、解釈できるようにしようというものだ。

大量の情報をもつ巨大なデーターベースとしてのWeb、をSemanticWebのイメージとして僕はもっている。

今までの僕は、Webという世界をJavaやRailsといった、システムエンジニアとして使用する技術を通じて眺めていた。

ちなみに、ここでいうWebというのは、インターネットとほぼ同じような意味だ。
多くの端末が繋がり、通信をしている世界、をイメージして使っている。

僕の視点は、Webという世界に携わると「日々、自分がどのようなIDEや言語を使って開発することになるか」という日々の仕事がどうなるか、というものだった。

多くのエンジニアは、技術が好きだ。
プログラミング言語が好きな人もいれば、DBが好きな人もいる。
ネットワークが好きな人もいれば、セキュリティが好きな人もいる。
オブジェクト指向設計が好きな人もいれば、テストが好きな人もいる。

そうした人たちは、自分が興味のある分野を嬉々として学び、その分野が発展してゆく未来に思いを馳せている。

僕もそうした技術を学ぶことが好きだけども、その未来を思い描けるほど、そしてその未来に魅せられるほど1つの分野に集中する、ということがなかった。

どちらかというと、自分が日々の仕事で使うのだけれども、自分がよく知らない分野について勉強することが多かった。

ようするに「好き」というのではなく、「必要」ということが動機となって勉強会にでたり、本を読んだりしてきた。

しかし、最近はWeb、インターネットという世界に魅せられてはじめてきた。
多くの人たちはすでに気づいていたであろうWebの価値を僕が実感し始めてきたからだ。

将来的に、Webはさらに多くの玉石混交のデータをたたえる巨大なデータベースになるだろう。
そして、人々は能動、受動にかかわらず、システムを通じて必要な情報を手に入れる。

必要な情報を必要な人たちへ、を実現する技術により発展してゆくWebの姿を想像し始めている。

なぜこんなことを考え始めたか。
きっかけは、8月6日に「Japan Innovation Leaders Summit」だった。

そこで、デジタルガレージの佐々木智也さんと、MITの石井裕さんの話を聞いた。

佐々木さんのお話では、Twitterが「情報の整理」という点で苦しんでいる現状を知った。

3.11の大震災におけるTwitterの使われ方を紹介していたなかでも、公式アカウントによる「公式RT」の推奨やハッシュタグの整理などを呼びかけたという話がされていた。

twitterには大量の情報が流れ、保持されている。
そして、その大量の情報を爆発的に伝播する能力も備えている。
しかしながら、正確な情報を整理して配信する、という能力には難がある。

現状、情報の整理はシステム化はできず、あくまでも呼びかけとそれに応える人びとの善意によって成り立っている。

僕が使い始めた当初から、twitterの検索はあまり信用できない。
その時の結果があまりにも信用できないものだったので使わなくなったので、現状の検索機能については、よく知らないが。

twitterは速報性、伝播性に優れているものの、ストックされている情報をうまく整理し活用する、ということに成功していないように思える。
もちろん、そもそもそんなことをtwitterは目指していないのかもしれない。

多くのデータを持っていても、それが活用できなのであれば、貯めておくことには価値はないのだ。

この佐々木さんの講演の後、石井さんの話を聞いた。
石井さんの話は大量のスライドと流暢な言葉によって、イメージと言葉のシャワーを浴びるような感じだった。

聞いた直後はビシビシ刺激されていろいろ考えていたのだけれど、ブログを書かない間に思考は流れでてしまった。

唯一、残ったのは「意味なきところに意味を見出す」という言葉だった。(というものの、かなり不正確な記憶でしかないけど。)

意味なきところに意味を見出す、というのは、全く根拠が無いのに意味がある、と主張することではない。
多くの人が同じものを見ていても発見できなかった、意味や関係性を別の視点や力を借りて再認識する、ということだ(と思う)。

この言葉を聞いたときに、思い出したのが仕事でよく耳にしていたデータマイニング、そして、Hadoopという言葉だ。

データマイニングという言葉は、多くの意味や知識をふくむアンブレラ・ワードだとかんじている。
なにか、ということを説明するのは難しい。

けれども、僕なりの解釈では「統計学などによるデータ分析をつうじて、新たな意味や関係性を物事に見出す」ことを意味している。
ようするに、今あるデータにたいして新たな意味付けを行い、捉え直す行為だと思っている。

そして、Hadoopはデータの分散並列処理を可能にするフレームワークだ。

Hadoopはレスポンスタイムが遅いためリアルタイムの処理に向かない。

しかし、大量のデータを処理する能力に長けている。
その能力がどれほどのものかは、クックパッドが紹介している実例から知ることができる。
http://www.slideshare.net/sasata299/hadoop-in

かなり乱暴な言い方だが、データマイニングにおいては大量データがあればあるほど、分析の精度を上げることができる。
しかし、大量のデータがあったとしても、そのデータを処理することができなければ、分析することはできず宝の持ち腐れだ。
Hadoopは、大量のデータを高速に処理し、分析することを可能にしたフレームワークなのだ。

世の中の技術は、大量のデータをいかに素早く処理し、信頼のおける方法でデータに意味や関係性を見出す方向に流れているのではないか。

自分は全く意識していなかったけれども、「意味なきところに意味を見出す」仕事にどうやら携わっているのではないか。

そんなことを8月6日にお二人の話を聞いて、意識し始めた。

それから少したったのち、googleで行われた第20回HTML5とか勉強会に参加した。

ここで羽田野太巳さんのお話を聞いて、僕のHTMLへの理解浅さを痛感した。
かなりざっくりといえば、
・HTMLはコンテンツの意味付け
・CSSは見栄え
を担当するものだと、この講演を聞いて始めて理解した。

僕の理解は、HTMLはホームページなどのWeb用のviewをつくるためのプログラミング言語、そして、CSSはviewを洗練するための拡張したツールというものだった。

しかし、これは的外れもいいところの理解だ。

HTMLはWebに公開されているデータが文章なのか、画像なのか、をはじめとして、そのデータがどのようなものなのか、を表現するものなのだ。
いわゆるその情報がいったいなにであるか、を説明するメタデータなのだ。

HTMLを拡張したXMLの使われ方を少し考えれば、わかることだ。
しかし、僕の頭の中にはHTMLが、データの意味付けを行うものだ、という認識はとても薄かった。

さらに、話の中でHTML5(というのもかなりアンブレラワードのようだけれども)はより、セマンティクス(意味付けと訳してよいだろうか?)機能が強化されたという話をきいた。

HTMLも、より意味付け機能を強化する方向に向かっているようだ。

つまり、Webという巨大なデータベースに大量に貯蔵されている情報にメタデータを付与して整理し、取り出せるようにする、という壮大な試みに向けて前進しているように感じられる。

有用な情報を必要な人へ届ける。しかも、人の手を煩わせずに。
人は、ラクラクとコンピューターによってせりした情報を得ることで、創造的な作業に没頭することことができる。

コンピューターに特になことを任せて、人にしかできないことに集中して取り組める世界。
まさに理想的な世界だ。

HTML5とか勉強会の会場だったgoogleもまさに、SemanticWebを担う最右翼の企業ではないだろうか。

googleボットというクローラーで自動に情報をかき集め、検索という行為によって情報を人々に与える、という企業活動は、SemanticWebというインターネットの父が示したWebの理想の姿を信じているからこそ、できることなのではないだろうか。

そんなことを2つのイベントを通じて感じ取った。
Webの世界は、徐々にSemanticWebに近づいてゆく。
そして、その世界を作り上げるのはとても楽しそうだ。

エントリを書いている途中、自分はかなりアタリマエのことを再認識しただけなんじゃないか、と思った。
で、このエントリを書いたあとにこんな記事を見つけた。
http://www.publickey1.jp/blog/10/10_3.html

これは、1年以上も前の記事だ。
そして、この記事よりも以前にSemanticWebへ流れや統計学への言及を行う記事は多数あった。

やはり、僕は最先端を行く人たちの影をみつけたことを喜んでいただけらしい。
最先端をゆく人びとは速く、そして遠い。

広告

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中


%d人のブロガーが「いいね」をつけました。