ニュースNEWS

データクレンジングツール「Masstery」 のカテゴリ自動分類精度が大幅向上 ~商品情報のカテゴリ分類を自動化、分類精度は最大96%~

2022年05月26日 ニュースリリース

フォルシア株式会社(本社:東京都新宿区、代表取締役社長:屋代浩子、以下フォルシア)はこのほど、当社が提供するデータクレンジングツール「Masstery 」に付随するオプション機能「カテゴリ自動分類」の改良を重ね、商品データのカテゴリを自動で分類する際の精度が最大96%を記録したことをお知らせします。

データクレンジングツール「Masstery 」は、不揃いなデータのフォーマット統一、更新情報の取得、不正データの検知などの70以上の機能を自由に組み合わせることで、人手でしか対応できなかったデータ整備を自動化するSaaS型のデータクレンジングツールです。2020年のサービスリリース以来、多くの企業様にご導入・ご好評頂いております。

この度、主に大量の商品を取り扱われるECサイト運営者様より強くご要望頂いておりました、カテゴリ自動分類機能の精度が「ルールベース」と「機械学習」の2つのロジックを組み合わせることで大幅に向上しました。

「カテゴリ自動分類」は、用途や形状に共通点のある商品群をカテゴリごとに自動で分類する機能です。カテゴリ別に分類された商品情報は、ECサイトや社内の在庫管理画面上での検索性が飛躍的に向上します。従来の「カテゴリ自動分類」ツールでは一般的に、分類根拠は明示できないものの、全ての商品情報に対して結果を出力することで高い検出率を実現させる「機械学習」ロジックが用いられていましたが、Massteryではこのたび、分類根拠のある商品情報に対してのみ分類を行う「ルールベース」を基本ロジックとして採用し、教師データから抽出した分類ルールや弊社独自の汎用性の高いルールを適用して分類することで高い精度を実現しました。また、「ルールベース」では分類できなかった一部の商品情報に対しては「機械学習」による分類を行い、全ての商品情報に対して結果を出力することが可能です。

今回の精度の向上においては、これら2つのロジックを組み合わせて両方のメリットを享受し、総合的な検出率は100%、精度は最大96%にまで到達しました。これにより、大量の商品の更新作業を行うECサイト運営者様の業務効率化や、サイトの検索性向上による売上げ拡大に寄与できるだけでなく、現在はWEB上での販売を行っていないユーザー様のネット販売事業の立ち上げにもご活用いただけます。

▼「ルールベース」と「機械学習」を組み合わせて分類した例(96%記録当時)

カテゴリ自動分類(数値).png

【データクレンジングツール「Masstery 」の特徴】

特徴1:手作業で行っていたデータクレンジング作業をノーコードで自動化
これまで手作業で行っていたデータの整備・更新・統合作業を簡単な3ステップの操作で自動化することができます。データの変換ルールも難しいコードを用いずに日本語的な表現を用いて登録することが可能です。

<操作手順>
1.データの変換ルールを登録
2.データをアップロード
3.データをエクスポート

特徴2: データ整備に必要な70種類以上の機能を組み合わせてご希望の変換を実現
豊富に取り揃えた70種類以上の機能を組み合わせて多様化するデータ整備のニーズにお応えします。VLOOKUPや別シートから引用しての置換など、通常のExcelを用いた作業では複数のシートを横断する変換も自動化が可能です。

▼各機能の詳細については下記製品ホームページを御覧ください。
https://mstr.forcia.com/


特徴3:複数のフォーマットへの出力が何度でも可能 
複数のデータをアップロードするだけで不揃いなフォーマットのデータを、ご希望のフォーマットに揃えて統合・更新します。また、出力する際のフォーマットも複数登録でき、何度でも出力し直せます。どのご担当様にとっても活用しやすい形でのデータ整備が可能です。

フォルシアは創業以来、膨大かつ複雑なデータの活用を強みとし、旅行業界を皮切りに商社やメーカー、試薬業界など業界を問わずデータを扱われる全ての企業様の課題解決を進めてきました。当社は今後も、国内・海外の多種多様な企業様の業務の効率化の一助となれますよう、製品の開発・改良を進めてまいります。

【操作画面イメージ】
▼ホーム画面(データアップロード用画面)

pic_02.png

▼変換ルール設定画面

pic_03.png

ニュースリリース
PDFダウンロードこちら

ARCHIVE

2022年

2021年

2020年

2019年

2018年

2017年

2016年

2015年

2014年

2013年

2012年

2011年

2010年

2009年

2008年

2007年