株式会社朝日新聞社様 Elasticsearchの導入事例やシステム構築例を紹介|システム構築やトータルソリューションをお探しなら、日立ソリューションズにお問い合わせください。

Elasticsearchの導入事例

株式会社朝日新聞社様

記事検索の仕組みを刷新し、AWSを使ったサーバーレス構成へ移行。性能を犠牲にすることなく質の高い検索エクスペリエンスを創出

総合メディア企業の株式会社朝日新聞社は、教育機関や図書館向けに過去の記事が検索できるデータベース・サービスを提供しています。しかし、それを支えるデータベース管理システムが複数存在し、運用負荷が高まっていました。このため、「Elasticsearch」を中核にしたシステムに統合するとともに、AWS(Amazon Web Services)を使ったサーバーレス構成へ移行。大規模な検索にも対応できる環境を整え、検索エクスペリエンスの改善に磨きをかけました。

メインイメージ

この事例に関するソリューション・商品

この事例に関するソリューション・商品

課題
効果
検索リクエストに合わせて複数のシステムを使い分けているため、記事の管理に手間がかかり、制約も多い
過去の発刊物にもOCRを使用して収録データを拡充したうえで、記事コンテンツを1カ所に集約
社内に物理サーバーを設置していたため、維持・運用の手間やコストが発生する
AWS環境でのサーバーレス化で運用負荷から解放され、ハードウェアの調達、維持、運用のコストも削減
マルチベンダーでシステムを構成していたため、統制した運用やシステム間の連携が難しく、拡張性に欠ける
シングルベンダーによるトータルな対応で、運用する現場の視点から使い易いシステムを実現

*OCR:Optical Character Recognition

新たな検索の仕組みをサーバーレスで構築

背景

データベース・サービスの運用が複雑化

星 氏朝デジ事業センター 開発部
ディレクター
星 克彦 氏

2029年に創刊150年を迎える朝日新聞社は、「つながれば、見えてくる。」をスローガンとするパーパスを定め、報道・言論機関としての責務を果たしつつ、新たな価値を生み出し、提供していくことをめざしています。そんな同社のサービスの1つに、教育機関や図書館向けに過去の記事を検索できるデータベース・サービスがあります。このデータベース・サービスはIT環境の進化やユーザーの要望に合わせて新しいデザインや機能を取り込み、より使いやすいものへと改善を繰り返しながら、お客さまに価値ある情報をお届けしています。

例えば、小・中学校、高校向け「朝日けんさくくん」では、簡単な新聞をグループワークで作れるようになる「ノートプラス機能」をリリース。また、大学・公共図書館向け「朝日新聞クロスサーチ」では、検索ワードのヒット数の推移をグラフで可視化できる機能や、読み返したい記事を100本まで保存できる「マイフォルダ機能」をリリースするなど、検索の新たな可能性を広げています。

しかし、同社は、これらのデータベース・サービスを支えるデータベースが複数存在することに長年頭を悩ませてきました。記事本文や記事の切り抜きイメージ、紙面のイメージを管理するシステムが別々に存在しているだけでなく、使用する検索エンジンやインターフェースなど、それぞれが異なる仕組みで運用されていたことが主な原因です。当然ながら管理に手間がかかるうえに、異なるデータベース上の記事コンテンツを同時に表示できないといった制約もありました。

「さらに、データベース管理システム側でアプリケーションのサポート終了やベンダーの事業撤退が相次ぎ、システムの仕組みを一度に見直すタイミングがやってきたのです」と有田氏。また一方で、「これを機に、社内に設置していた物理サーバーの維持・運用の負荷から解放されたい思いもありました」と星氏は語ります。

取り組み

新たな検索の仕組みをサーバーレスで構築

有田 氏メディア事業本部 サービス開発部
次長
有田 晶子 氏

こうして旧システムをリプレースする大規模なシステム統合プロジェクトが始動。システム刷新の先に新たな価値提供を見据える同社の狙いは、次の3つにありました。1つ目は「収録データの拡充と記事コンテンツの集約」、2つ目は「検索エンジン刷新による新しい検索機能の提供」、3つ目は「AWSを使ったサーバーレス構成によるハードウェア調達、システム開発、維持・運用にかかるコストの削減」です。

プロジェクトでは、これら3つすべてに対応できるパートナーが求められました。検索エンジンには、実績が豊富で安定性と信頼性に優れた「Elasticsearch」の採用を視野に入れていたため、同製品の販売代理店数社に声をかけてコンペティション(コンペ)を実施。最終的に日立ソリューションズを選定した理由については、「検索エンジンの刷新だけでなく、インフラの構築から書誌情報を編集する機能の充実に至るまで要件が非常に幅広く、かつ短期間という条件があるなかで、すべてをお任せできるベンダーとして評価しました。社内リソースが限られているため、当社の負荷が少ないことへの期待もありましたし、できないことに対してはできないと明言したうえで代替案を提案してくれるなど、寄り添ってもらえる安心感がありました」と有田氏。

日立ソリューションズは、旧システムから抽出した約1,000万件もの記事コンテンツや約700万件におよぶ明治・大正以降の画像データを移行する作業を行いました。また「朝日けんさくくん」や「朝日新聞クロスサーチ」などのデータベース・サービスと「Elasticsearch」をつなぐ検索用API機能や社内編集用Web画面、運用で使用するコマンドの提供を、AWSを使ったサーバーレス構成で実現しています。さらに、運用する現場の視点から使い勝手のよいシステムをめざしたという宮山氏は、日立ソリューションズの貢献について、「我々が人力で乗り切ろうとしていた場面でも、より負荷が少なく実現性の高い方法を提案してくれました。経験上運用することが難しい内容だと判断したら、費用対効果を踏まえて全力で軌道修正してくれたこともありました」と評価します。

効果

地域面のテキスト検索も可能に

宮山 氏コーポレート本部 システム部
宮山 尚也 氏

システム統合プロジェクトを経て、当初の3つの目的を達成した同社は、AWSを使ったサーバーレス構成への移行による運用負荷軽減のメリットに加え、新たな可能性を見いだしています。

「物理サーバーからクラウドに移行すると、ともすると要件が満たされないことも多くなりがちですが、性能を犠牲にすることなく当社の要件を網羅できたことに満足しています。稼働後に問い合わせがまったくなかったことも驚きです。日立ソリューションズが仕様と営業部門からの要望とのずれが生じないよう丁寧に対応してくれたおかげです」と宮山氏。

また、「サービスの付加価値になる新しい機能を作りやすくなりましたね。言い換えれば、改善のスピードを上げて競争力を高められるということです」と語る有田氏に続き、星氏はその一例を挙げ、こう説明します。

「このタイミングで、OCRを使用した過去の地域面の記事検索を実現しました。これまでは都道府県単位でしか検索できなかったのですが、スキャンした古い新聞紙面をAIが解析して自動で記事や見出しの領域を検出し、それをすべてテキストデータ化することで検索を可能にしました。この技術を利用してリリースした『地域面検索β版』は、現在の検索対象期間(1991年から1996年)を過去にさかのぼって拡大していく計画です」

展望

新たな仕組みが生み出すビジネス成長に期待

データベース・サービスを支えるシステムを、「Elasticsearch」を中核にした拡張性の高い仕組みに変えることで、質の高い検索エクスペリエンスの提供を可能にした朝日新聞社。

宮山氏が「価値ある新しいサービスを生み出しやすい環境が整ったということは、営業部門が契約を獲得するための”売り”が増えるわけで、間違いなく今後のビジネス成長につながっていくはずです」と確信するように、同社の事業展開にスピード感と広がりを生み出しています。

日立ソリューションズは、今後も専門知識と提案力で朝日新聞社のさらなる発展を支援してまいります。

株式会社朝日新聞社

所在地 東京都中央区築地5-3-2 株式会社朝日新聞社
創刊 1879年1月25日
従業員数 3,742名(2025年4月現在)
事業内容 新聞・デジタルメディアによるコンテンツ事業、展覧会などのイベント事業、不動産事業
URL https://www.asahi.com/corporate/

この事例に関するソリューション・商品

この事例に関するソリューション・商品

導入事例ダウンロード

本事例の内容は2025年5月21日公開当時のものです。

最終更新日:2025年5月21日