AIモデルの精度向上に欠かせないアノテーション。近年ではアノテーションの需要が高まり、さまざまなアノテーションツールが利用できるようになっています。AI技術を導入している方の中には、アノテーションツールの導入を検討している方もいるはずです。
そこで問題になるのが、「自社ではどのアノテーションツールを使えばいいのか?」です。アノテーションツールと検索しても多くのツールが紹介されていて、どれを使うべきか決めかねる担当者も多いのではないでしょうか。
この記事では、代表的なアノテーションツールを12種類紹介し、比較できるようにしました。最適なツールを選ぶポイントや迷った時の選び方も解説しているので、スムーズにアノテーションツールが選べるようになるでしょう。
アノテーションツール選びで迷っている方は、ぜひ参考にしてみてください。
アノテーションツールとは、AIモデルの精度向上に欠かせないラベリング作業を効率化するツールです。本記事では、以下のアノテーションツール12選を比較しています。
それぞれのアノテーションツールを比較し、ツール選びの参考にしてみてください。
AnnoEaseは、アノテーション外注費用の見積り、発注、そして教師データの受け取りまでワンストップで実行・管理できるアノテーションツールです。
発注に伴う手間やストレスを大幅に削減できるため、要件整理や仕様書を作成するリソースの不足、外注における委託業者とのコミュニケーションコストの肥大化といった問題の解決に役立ちます。
また、AnnoEaseでは要件定義から教師データの作成までまとめて依頼できる上流工程支援サービスも行なっています。委託業者と密にコミュニケーションを取りながら要件整理を進めつつ、機械学習アルゴリズムや周辺システムの相談までしたい方におすすめです。
公式サイト:https://www.nextremer.com/data-annotation
LabelBoxは、高精度な教師データでラベル付けができるアノテーションツールです。モデルトレーニング、診断、ラベリングサービスを1つのプラットフォームで提供しています。
画像とテキストのアノテーションができるソリューションを提供していて、多様なプロジェクトに適用できます。直感的なアノテーションが可能で、操作性も優れています。
また、LabelBoxはさまざまな出力形式に対応していて、社内で使われているAIフォーマットに調整できるのも特徴です。アノテーションの品質に影響しうるデータを訂正する機能もあり、運用をサポートしてくれます。
公式サイト:https://labelbox.com/
VoTTは、マイクロソフトが提供するオープンソースのアノテーションツールです。MITライセンスに基づいており、無料で利用できます。
主に画像や動画のアノテーションに使用され、多様なフォーマットに対応しています。Windows、MacOS、Linuxで利用可能です。
さらに、Azure AI Custom Vision、TensorFlow(Pascal VOCとTFRecords)、CSV形式など、さまざまな形式でラベルデータをエクスポートできます。
VoTTにはトラッキング機能という人物や物体を追跡する機能があり、動画アノテーションとして活用できます。インターフェースにはGUI操作が導入されているため、初心者でもスムーズにアノテーションを行うことが可能です。
タスク管理機能は多くないので、短期間の利用が向いています。現在はVoTTはアップデートされていないため、最新の機能やサポートを必要とする場合は他のツールも検討する必要があります。
公式サイト:https://github.com/microsoft/VoTT
CVATはローカルにインストールして利用することが可能なオープンソース版とクラウド版で提供されているアノテーションツールで、無料から利用できます。
バウンディングボックスやポリゴンセグメンテーションのタスクが可能で、画像と動画のアノテーションに優れた機能を持っています。半自動アノテーションやトラッキング機能も活用できて、大量のデータを処理することが可能です。
クラウド版では、インストール不要で設定が必要ないため、すぐにアノテーションを実施できます。オープンソース版もクラウド版も、直感的で使いやすいGUIも特徴です。誰でも簡単にアノテーションを始められるのが、CVATの強みです。
LabelMeはMIT(マサチューセッツ工科大学)が開発したオープンソースの無料アノテーションツールです。拡張性に優れており、Pythonベースでのカスタマイズや機能拡張を行えます。
ブラウザ上で利用可能で、画像や動画のアノテーションを得意としています。ユーザーフレンドリーなインターフェースが特徴です。
キーポイント、バウンディングボックス、ポリゴン、セマンティックセグメンテーション、インスタンスセグメンテーションでのアノテーションに対応し、直感的に作業できます。
アカウントの作成やログインも不要で、簡単なアノテーションであればすぐに実行できる利便性の高いオープンソースツールです。
公式サイト:https://github.com/labelmeai/labelme
Amazon SageMaker Ground Truthは、AWS(Amazon Web Service)が提供する、ヒューマンインザループ機能を組み込んだアノテーションツールです。
スケーラブルなデータラベリングが可能で、AIモデルを使用して自動的にデータにラベルを付け、人間による確認が必要な場合のみ作業者に送信する半自動のラベリング機能も備えています。
画像、テキスト、動画、音声、3D点群など、30種類以上のアノテーションに対応しています。
また、専門家のサポート・代行も可能で、アノテーションフローの作成や管理を行ってもらうことができます。これによって、高度な教師データの作成やアノテーションの内製化も可能です。
公式サイト:https://aws.amazon.com/jp/sagemaker/groundtruth/
V7は、AI開発のためのデータ管理、アノテーション、モデルトレーニングを包括的にサポートするプラットフォームです。無料トライアルから企業向けカスタムソリューションまで、幅広いニーズに対応しています。
自動アノテーションが利用できるツールとして人気です。AIによるトレーニングが完了していて、アノテーション作業の時間を短縮しつつ、正確に行うことが可能です。3Dデータや複雑な画像データのラベリングにも対応しています。
また、ワンクリックでアノテーションができるなど、手動でも簡単に操作できます。さらに、データセット管理・レポート機能も充実しており、大規模データセットの管理に適しています。アノテーションデータにコメントを付与できるため、チームでの作業でも情報共有が簡単です。
公式サイト:https://www.v7labs.com/
Annotoriousは、JavaScriptで構築された画像アノテーションツールで、オープンソースで利用できます。Webサイトやアプリケーションに画像アノテーション機能を簡単に追加できる柔軟なツールとして、研究プロジェクトやデジタルアーカイブなど、様々な分野で活用されています。
GitHubでソースコードが公開されているため、手軽に導入できます。キーポイント・バウンディングボックス・ポリゴンといった画像アノテーションをサポートし、JavaScriptを書き込むことでラベリングが可能です。わずか数行のJavaScriptコードで画像にアノテーション機能を追加できます。
JavaScriptはプログラミング言語であり、プログラミングの知識があれば独自性のあるシステムにカスタマイズできます。プログラミングができる人材が社内にいれば、候補となるアノテーションツールです。
オープンソースで手軽に利用できる
画像アノテーションが得意
プログラミング言語ができればカスタマイズも可能
公式サイト:https://annotorious.github.io/
幅広い分野で活用できるサービスを提供しているFastLabelは、日本企業が提供するアノテーションツールです。
アノテーション・教師データ・MLOpsの作成や構築が可能で、幅広いプロジェクトに対応したソリューションを利用できます。AIによる自動アノテーションも可能で、作業負担を大幅に軽減します。
導入実績100社以上、ラベル提供1万以上と、多くの企業に利用されているのも特徴です。アノテーションの種類や出力形式が豊富にあり、対応範囲が広いため、導入しやすさがメリットと言えます。
公式サイト:https://fastlabel.ai/
ProLabelは、アノテーション作業やデータセットの管理に優れたアノテーションツールです。Bounding Boxトライアル版、Bounding Boxエディション版、プロ版の3つのプランがあり、それぞれのプランに応じた機能とサポートが提供されます。
ProLabel独自のAIによる画像アノテーションや教師データの作成が可能で、効率的なバウンディングボックスの付与とラベル付けが行われます。元画像に反転やぼかしなどの処理を加えてデータセットを拡張し、新たに生成された画像にも自動でラベル付けを行うデータ拡張機能を特徴としています。そして、AIを活用することで、自動で精度の高いデータラベリングが可能です。
アノテーションデータは確認モードやハイライト機能で修正できます。出力形式はtxt・xml・csv・jsonに対応していて、フォーマットに合わせやすいのもおすすめするポイントです。
公式サイト:https://www.profield.jp/product_prolabel.html
harBestはデータの収集・作成を発注できるサービスで、クラウドソーシングシステムを採用しています。データ収集からアノテーション、プロジェクト全体設計までサポートしてくれます。
harBestに登録しているアノテーションユーザー(クラウドワーカー)がデータの収集や作成を代行するため、アノテーションにかかる時間を大幅に削減することが可能です。品質管理体制も充実していて、質・量ともに優れたデータをアノテーションに活用できます。
また、harBestが提供している独自開発プラットフォームを、月額で利用可能です。独自開発プラットフォームはAI開発にかかるコストを削減し、アノテーションの内製化にも効果的です。
公式サイト:https://harbest.io/
Annofabは、画像、動画、3Dデータに対するアノテーションを効率的に行うためのクラウド型オールインワンアノテーションツールです。ほとんどの機能を無料で利用可能なので、低コストで高品質なアノテーションを生産することが可能となります。
画像、動画、3Dデータ、表、時系列データなどのアノテーションに対応していて、素早く正確にデータを編集できるエディタが用意されています。他にも音声・マップ・言語・時系列といったデータや、分類・追跡(トラッキング)・検出のタスクに対応し、使いやすいツールにカスタマイズすることが可能です。
品質を保証するワークフローやアノテーターによるサポートなど、導入後も手厚いサービスを受けられます。デモ依頼も可能で、試運転による操作性のチェックもできます。
公式サイト:https://annofab.com/
アノテーションツールは、以下のポイントを押さえて選ぶことが重要になります。
|
それぞれについて解説します。
最適なツールを選ぶには、自社のプロジェクト目的に合致しているかどうかを判断する必要があります。
高精度な画像アノテーション機能を必要とするプロジェクトや、大量のデータを処理できる(半)自動アノテーション機能を必要とするプロジェクト、といったように、活用シーンによって求められる機能や特徴が異なります。アノテーションツールの導入が目的になっていると、業務に活かすことができません。
どの業務で活用したいのか、導入によって何を達成したいのかを明確にすることで、自社に最適なアノテーションツールを選べるようになります。
参考記事:
「アノテーションはなぜ自動化が難しいのか?手動アノテーションが必要なケースとは?」
アノテーションツールの選定において、操作性の良さも重要なポイントです。直感的で使いやすいインターフェースは、作業効率の向上に貢献します。
アノテーション作業は細かい操作が多いため、ツールのレスポンスが良く、ユーザーがストレスなく作業を進められるかどうかが求められます。また、ショートカットキーや補完機能が充実していると、作業スピードがさらに向上します。チームでの共同作業を行う場合、複数ユーザーでの同時編集やリアルタイムでのフィードバック機能があると便利です。
操作性を判断するには、デモ版やトライアル期間を利用して実際に操作してみるのがおすすめです。導入前に必ず試運転をしてみて、操作性がマッチするか見極めましょう。
アノテーションツールが生成する出力形式が、自社のAIモデルに適した出力形式に対応しているかも選定時に確認しましょう。
異なるフォーマットでデータが出力されると、変換に手間やコストがかかります。そのため、最初から自社の求める出力形式で出力可能なツールを選定すると良いでしょう。特定の機械学習ライブラリやフレームワークに対応したフォーマットをサポートしているツールを選ぶことで、データの形式を変換する手間を省くことができます。
管理機能が充実しているアノテーションツールでは、効率的な作業が可能です。
アノテーションツールを活用したプロジェクトが大規模になるほど、データの整理・進捗管理・品質チェックが膨大になり、タスク管理が難しくなります。そのため、アノテーションツールに管理機能が搭載されていると、アノテーションデータを効率的に管理し、作業状況を把握しやすくなります。
フィードバック・レポート・バックアップなどの機能がツール内で完結していると、データを管理しやすくなるでしょう。これらの管理機能にも注目して、アノテーションツールを選びましょう。
今回はアノテーションツールを12種類紹介しましたが、国内外を含めてさまざまなアノテーションツールがあり、選定には時間がかかるでしょう。アノテーションツール選びで行き詰まったら、国内開発のツールを検討してみるのがおすすめです。
国内開発のアノテーションツールは日本語に対応しているため、操作やマニュアルの理解が容易です。言語の壁を感じることなく、スムーズにアノテーション作業を進めることができます。
また、サービス提供会社の担当者と直接コミュニケーションが取りやすい点も、大きなメリットとなるでしょう。日本国内の企業であれば、タイムゾーンの違いや言語の問題を気にせずにサポートを受けられます。これによって、問題解決カスタマイズの相談がスムーズに行え、迅速な対応が可能です。
日本国内にもアノテーションツールを提供する会社は多いため、ぜひ検討してみてください。
この記事ではアノテーションツールを12種類紹介しましたが、これら以外にも数多くのツールがあります。自社に適したツールを選ぶには、時間がかかるでしょう。
本記事で紹介したように、目的・操作性・出力形式・管理機能を基準にすると、よりスムーズに最適なツールを選べるでしょう。どうしても決められない場合は、日本語に対応したアノテーションツールを優先的に比較するのがおすすめです。
作業の効率化や時間短縮を実現するために、アノテーションツールの種類や選び方を理解しておきましょう。
ただし、医療画像や特殊な技術分野など専門的な知識が必要なアノテーションや、社内でのリソースが限られている場合はアノテーション作業を外注することで、効率性、品質、コスト面でメリットを得られる可能性が高くなります。