項目別バックナンバー[1]:インターネット情報:16

検索エンジン

検索エンジンについては度々話題にしています。
インターネットの基本のひとつですので、次々と話題があります。
ひとつは、アメリカのグーグルへの情報提出要求問題、日本では国産検索エン ジン開発問題です。
検索エンジンは、世界中のホームページの情報収集が出発にあります。これは スパイダーとかロボットとか呼ばれるソフトで行われます。この膨大な情報 のデータベースの解析から検索の順位付けが始まります。
逆に言えば、検索エンジンをもっている所は世界中のホームページのデータベ ースをもっているとも言えます。
ホームページのメタタグ部の「robot」の有無でロボットの情報収集にかかるか かからないかが決まると言われた時期もありましたが、スキャンソフトの問 題なので、このような事はどうにもなります。実際は・・・。収集データの 提出要求や拒否は、収集方法・解析方法の秘密のノウハウ・技術と直接に繋 がりますので、簡単には決着しません。

ネットが拡がる程、探し物が存在する可能性が増え、同時に探すのが困難にな ります。そこに出てくるのが、カテゴリー・ポータルサイトであり、検索エ ンジンです。
ホームページは日々、膨大な量で増えかつ更新されますのでこれらをあるてい どの頻度で反映できる仕組みが必要です。
検索エンジンの技術は全て、非公表です。しかし、特定のキーワードで上位に 表示させたいと誰しも考える事です。
検索エンジンを騙す行為ともいえる設計は、いつも需要があり、検索エンジン はこれを避けて、より多くの使用者が目的のものを容易に得られる改善が行 われます。
従って、前回は検索技術は、ホームページのデータベース構築技術としました が、これに使用者を特定のホームページに誘因する技術でもある事が分かり ます。
本来は、情報の量・質・新しさなどを如何に正しく選別するかが問題です。当 然ながら、そこに設計者の作為を加える事も可能です。

OSのウインドウズでパソコンを殆ど制覇した(現状)マイクロソフトは、OSと の相性と先行開発という利点で関連ソフトも同時に事実上の標準としました。 最も顕著なのがプラウザをネットスケープから奪った事でしょう。(ただし 今後は不明)
オフィスソフトも実質は、市場を支配しました。ただ完全にはいかない部分は 表計算のロータス1/2/3と、ローカル統合ソフトのノーツでしょう。
同時に日本語ワープロソフトのジャストシステムの一太郎も(正確には日本語 フロントエンドソフトのATOK)壁として残っています。
最後の件は、OSの基礎設計が英語用になっている事と日本語を代表とする多文 字言語が壁と言われていました。
所が、グーグルの検索エンジンはこの壁を越えていると言われています。デー タベースはともかく、解析は日本語の取り扱いが重要で細部は??の時も発 生しますが、大きな欠陥は感じません。
国産検索エンジン開発は、技術面で得る事は多いと思いますが、少なくても日 本語の扱いでのアドバンテージは大きくはないように思えます。

現在、日本だけがグーグル検索エンジンが主流でないといわれています。
ホームページを持たれておりアクセス解析をされている方は、検索エンジンか らの訪問者を分析していると思います。
ページ数の少ないサイトでは、差がないですがトップページ以外にコンテンツ が多いサイトでは、グーグルではコンテンツページに直接検索エンジンで来 る事が多く、ヤフー等ではトップページへくる事が多いと経験的に感じます。
どの程度一般的か分かりませんが、深いページのコンテンツまで検索する時は グーグルが適していると感じます。
グーグルはオープンソース指向ですので、OSはリナックス系という事で現在の インテル・マイクロソフト系のOSではアクセス解析情報が文字化けしている のが普通です。
自分のホームページの検索エンジンへのかかり方をチェックしてみましょう。


ネット辞書

ネットの世界には、通常人が考えるものは大体はあります。
勿論辞書もあります。
最終的には、フリー百科事典「ウィキペディア(Wikipedia)」の話に持って ゆくのだが、別にこれに拘らなくてもどの辞書のネット版も揃っています。
「ラルク」のような、ポータルサイトを形成しているものも存在します。
辞書を引くという行為は、目的の言葉を探すことなので、前回まで話題にして いた「検索」と同じ行為です。
ネットでの検索が重要と認識すれば、検索機能と辞書が相性が良いことも自明です。
パソコンを購入すると、辞書CDが添付されていた時期もありました。インター ネットの普及が進んでいないと誰でもがネット上で使用できなかったからです。

言葉を探すならば、検索エンジンも使用できます。内容の詳しさからは優位な 時も多くあります。問題は、ネット世界の特性として情報発信先の信頼性が 明確でない事です。
専門の辞書出版社のネット版でも、100%完全の保証などはありませんが信 頼性がある程度高く確保できることはわざわざ調べなくても予想と期待が出 来ます。
紙ベースが出発の辞書をローカルで使うか、ネットで使うかは利用者で優位が 異なるでしょう。改訂・費用などを考慮するとともに、最近は携帯性の優れ る電子辞書も選択の1つになります。
ネット辞書は、ネットならではの特徴がある場合が有効になります。スピード の面ではローカルには劣ります。携帯性は電子辞書に劣ります(ノートパソ コンでも)
使用頻度の低い辞書・特殊な専門辞書は改訂も含めてネット上での使用が優位 と考えます。
内容の深さを求める時も、ネット辞書は優位になる可能性を持っています。こ の発想からネット上の成長する百科事典の構想が生まれます。

ネットワークが出来ると、「分散」という概念が拡がります。古くは巨大コン ピュータ1台がマルチタスクで動作していましたが、小型のコンピュータを 多数台接続して全体で何かを行う考え方です。グーグルのコンピュータの運 用はこの方式である事は知られています。
オープンソースの考え方も、類似です。基本を公開して複数の人で改良を行っ てゆこうとします。
百科事典にこの考えを入れたのが、ネット辞書のフリー百科事典「ウィキペデ ィア(Wikipedia)です。
各項目については、全てが網羅されている必要も正しい必要も出発では必要と しません。アップされた内容をアクセスした人が正しく詳しく、修正・書き 加えてゆきます。マイナス成長もありますが全体的にはプラス方向になって ゆく事が知られています。
勿論、項目がなければ新しく項目を追加して出発にする事も出来ます。
ネットにアクセスして、この辞書にアクセスする人全体が作り上げてゆく辞書 といえます。

ネット辞書のフリー百科事典「ウィキペディア(Wikipedia)は、利用者が作り あげてゆく辞書です。
誰かが項目を作り記入する事で始まります。その内容は、不十分でも極端には 誤りがあってもスタートできます。
それを読みに来た人は、内容に不備をみつければ修正します。修正が正しいと の保証もありませんが、複数の人が書き換えを行ってゆくうちに次第に内容 が良い方向に変わってゆくとされています。
それに要する時間は、該当項目にアクセスする人の数によります。ただ、ネッ トの世界では予想以上に多いし、早いといわれています。

ネット辞書のフリー百科事典「ウィキペディア(Wikipedia)は、急激に浸透 しており、グーグル等の検索エンジンで何かを調べるとかなりの割合でトッ プに表示されます。
性格上、全て正しいとの保証はありませんが充分に利用できるレベルが多いと いえます。
かなりの項目、特に使用頻度の少ない項目で「情報の追加、校正」を促す表示 があります。新しく作られた項目や書き込みの少ない項目やアクセスの少な い項目を中心に、完成度が低い項目では普通に目立ちます。
もし、関連項目について情報や校正すべき内容があれば、誰でも事典の完成度 を上げる過程に参加する事が出来ます。
書き込んだ内容が、必ず残るとは限りませんがあなたも参加して見ませんか。

ネット辞書のフリー百科事典「ウィキペディア(Wikipedia)」は、前回までの 経過で成り立っているために、通常と異なる性質があります。
しばしば、新項目が次第に精度が上がる傾向のテストがされています。ただ、 項目のアクセスのされかたでそのスピードはかなり異なります。
丁度数学の確率分布のように、どのような項目でも無限大の時間経過後は、精 度が確保される事は期待できますが、実際に使用する範囲では異なります。
殆どアクセスされない項目・同じ項目で複数の意味がある項目のマイナー側等 は、相当長い時間が経過しないと内容は正しい方向に変わってゆかないと思 われます。
間違った情報の追加・変更の可能性は絶えずありますが、これをうわまる修正 は多くのアクセスと、誤解の少ない項目設定の時に早く行われる事が期待さ れます。一応検索エンジンで早く見つかる項目は、正しくなる要因が満たさ れていると思われます。
検索でなかなかみつからない時は、まだ未完成との注意が必要でしょう。

このページの先頭へ