websonaとは
探索
対応状況
FAQ
戻る

Blog


ブログ2021/08/21

websonaが目指す世界とは?

お疲れ様です。
しらせです。

本日からブログのスペースをこちらに移動しました。

今年2月にリリースした本サービスについて少し深堀してお伝えしたいと思います。
特にどのようなユースケースを想定しているのか?どんな目的で使うものなのか?などを詳細にまとめます。

もくじ

websonaが目指す世界

まずwebsonaが目指そうとしている世界についてです。

主に以下の通り「3つの頼らない」を目指しています。

  1. RSSに頼らないシンプルな情報収集
  2. 検索に頼らず好きなWebサイトの一覧を自分で作る
  3. botに頼らないエコ(低負荷)な仕組み

1.RSSに頼らないシンプルな情報収集

1つ目がRSSに頼らないシンプルな情報収集を実現したいという点です。

Webサイトを見ていると必ずと言ってよいくらいページの片隅に「RSS」の文字を見かけます。

PCやスマホを問わずRSSリーダーを利用することでWebサイトの更新情報をキャッチできる点でとても便利です。

一方で、RSSという仕組み自体については無駄や不便さがあると感じています。

例えば使う側の視点としては、
RSSを利用するために専用アプリをインストールしたり、WebページのRSSフィードリンクを探したり、登録したRSSの更新設定を入れたり。

サイト管理者側の視点としては、
Webページの更新や記事の追加だけでなくRSSフィードを修正する作業も必要になります。

欲しい情報はすべてWebサイトに載っているのに、WebサイトがRSSに対応していなければそもそも利用すらできません。

このように、更新情報が欲しい・届けたいだけなのに利用者も管理者もそれなりの苦労があります。

websonaはWebサイトのURLさえ分かっていれば利用が可能であり、面倒なアプリのインストールや設定などの手間をかけさせません。

2.検索に頼らず好きなWebサイトの一覧を自分で作る

2つ目がインターネット検索結果に依存せず、好きなWebサイトの一覧を自分で作ることができるという点です。

インターネット検索は非常に強力で膨大な情報の中から自分が欲しい情報を的確に提案してくれます。

一方で検索の結果はその時々で変わることがあり、以前検索で引っ掛かっていたWebサイトが今では引っ掛からないこともあります。

これは検索結果の表示順位が常に変動しているために起こります。

websonaでは興味のあるWebサイトを上位に表示したり、更新が少なくて見る頻度の低いWebサイトを下げたりすることで、自分が今興味のあるWebサイトを好きな表示順で作ることができます。

3.botに頼らないエコ(低負荷)な仕組み

3つ目がbotに頼らない低負荷な仕組みを提案します。

インターネット検索サイトのクローラやRSSアプリは定期的な巡回チェックを行うことで変更をチェックしています。

例えばRSSの場合、以下の3つのいずれかの頻度がマッチしないと無駄や不便が生じてしまいます。

  • Webサイトの更新頻度
  • 巡回チェックの頻度
  • 利用者のチェック頻度

更新頻度が少ないWebサイトに対して頻繁にチェックをしてしまったり、RSSを利用しなくなってもバックグラウンドでは動作し続けてしまうこともあります。

websonaでは巡回チェックの頻度は最短で1時間の更新ウィンドウを設けており、それより短い間隔ではチェックは行われずwebsona側に一時的なキャッシュ情報が保持されます。

キャッシュ情報更新のための巡回チェックはwebsona利用者からの更新チェックを契機として1時間経過後に実行されるため、同一のWebサイトを登録している方が多ければ多いほど1時間に1回必ずキャッシュが更新される動作になります。

一方で、同一Webサイトを登録している方が少ないと更新チェックの回数も必然的に少なくなり、Webサイト側への巡回チェックの頻度も減少します。
そのためWebサイト側への不必要な通信を無くすことができ、WebサイトとPC/スマホの両システムの負荷を下げることができるエコなサービスとなっています。

ユースケース

websonaがターゲットとしているユースケースには以下のようなものがあります。

  1. ブログの更新情報のキャッチ
  2. まとめサイトのトピックの収集
  3. ニュースサイトのトピックの収集
  4. Webサイト全体の変更の把握

特に個人が運営しているブログやWebサイトの場合は、RSSに対応しているケースの方が少ないと思います。
1番目にあるように、個人・法人問わずブログの更新情報のキャッチにとても有効です。

2,3番目にあるようにまとめサイトやニュースサイトは必ず「見出し」が設定されています。
websonaではその見出しに相当する情報を収集する形でトピックとして収集も可能です。

Webサイトによっては見出しなどが設定されていないケースももちろんあります。
その場合は4番目のようにWebサイト全体の表示内容を元にした更新判定をすることで、Webサイトの変更を把握することが可能です。

websonaで想定している主なユースケースは以上になります。

利用例

1つ使い方の例をご紹介します。

以下は情報掲載サイトGIGAZINEとプレスリリース掲載サイトPRTimes(テクノロジー)の例です。
両サイトともに40個以上のトピックを検出しています。

トピックの抽出は以下の流れでチェックされます。
WebサイトのHTMLソースに含まれる10文字以上のh1タグ、h2タグ、h3タグをチェックします。

  1. h1タグ(10文字以上)
  2. h2タグ(10文字以上) ※h1タグが1つも引っ掛からない場合
  3. h3タグ(10文字以上) ※h2タグが1つも引っ掛からない場合

Webサイトによって使われるタグは異なるため、特にメジャーなタグから順にチェックをすることで最適な情報の抽出を実現しています。

※現状すべてのWebサイトの対応はできておらず、スクリプトによって動的に作成されたページやHTMLタグの種類の関係で取得できない場合もあります。

以上