ブログ記事一覧|株式会社Nextremer

アノテーション代行会社に外注?内製する?代行業者の選び方は?外注のメリットを徹底解説!

作成者: 株式会社Nextremer|Jul 5, 2023 12:41:00 PM

 


アノテーションは、よほど慣れていない限り代行の依頼にかかる費用や納品の品質が予測しにくい工程のため、どこにどうやって代行を依頼すれば良いのか迷いがちです。いっそ、内製の方がコントロールしやすいのでは?と悩んでいる方も多いかと思います。

本記事では、アノテーション作業を内製する場合の懸念点、アノテーションサービスを提供する代行会社に発注することのメリットや注意点、アノテーション代行会社の選び方を分かりやすく解説します。

内製時にどれだけ負担がかかるのかや、コスト面でどちらが有利かなどを紹介しておりますので、内製化するか代行を依頼するか迷っている方はぜひ参考にしてみてください。


 

 

【目次】
  1. 自社でアノテーション作業(内製)を行うメリット・デメリットは?
  2. アノテーション代行会社に外注するメリットは?
  3. アノテーション代行会社の選び方
  4. まとめ|アノテーション代行会社は目的に応じて選ぼう

 

 

1. 自社でアノテーション作業(内製)を行うメリット・デメリットは?


費用削減のために、アノテーションの内製を考えている方もいるのではないでしょうか。
ここでは、アノテーションを内製した場合、どのような業務コストが発生するのかの見通しを解説します。


ツールを使っても作業は高負荷

精度の高いAIを開発するためのアノテーションには、一般的に数千~数万枚ものデータが必要とされます。例えば、写真内の物体に対してアノテーション(物体検出やセグメンテーションなど)をする場合でも、一部の簡単なタスクでは数百枚、一方で複雑なタスクでは数十万枚以上のデータが必要な場合もあります。

もちろん、タスクの具体的な内容や目指す精度により、必要な画像データの数は大きく変わります。精度の良いAIを作ろうとする場合や、医療に用いられるAIモデルを構築する場合には、より多くのデータが必要になるでしょう。

内製する場合は、まずデータを収集してから、それらのデータを一つ一つアノテーション作業していかなければなりません。ツールを利用しても、画像のアノテーションは100枚で1時間ほどかかるため、10,000枚のデータを作成するには、100時間ほどはかかってくるでしょう。

もちろん、タスクの内容やアノテーションツールの性能、そしてアノテーションを行う人のスキルによって所要時間は大きく変わります。一部の高機能なツールではAIを使って半自動的にアノテーションを行う機能があります。AIがアノテーションをサポートしてくれるため作業は楽になりますが、自動でアノテーションされたものが正しいかどうかは、実際に人が見て判断する必要があります。

このように、アノテーションには非常に多くの工数がかかるため、ツールを利用しても作業は膨大な量になります。


社内にAI人材がいるのならば内製も可能

偏りのないデータを必要数用意して、アノテーション作業の時間を確保でき、会社内にデータ選定やメンテナンスを適切に行えるAI人材が多くいるのならば、自社内でのアノテーション作業も可能でしょう。

しかし、日本ではAI人材が不足しているうえ、質の高いAIモデルを構築するのが困難だと考えている会社が多いことも事実です。世界1,144社に行われた調査では、3割程度の企業がAIの質に対して不安を抱いています。




出典:総務省・三菱総合研究所ICTによるイノベーションと新たな エコノミー形成に関する調査研究

また、AIの導入を先導する人材不足のために、多くの日本企業がAI導入に不安を抱いていることが分かります。高度なAI人材の採用にかかるコストを考えると、内製でのアノテーションは事業の展開スピードとコストパフォーマンスを損なう恐れがあります。


代行を依頼したほうがコスト面で有利になることが多い

アノテーションを内製できる環境があるのならば、会社内のAI人材が一貫してAIモデルを構築する手もありますが、代行を依頼したほうがコスト面で有利になることが多いです。内製は一見安上がりな印象がありますが、膨大な作業をこなすための人件費や、アノテーションができるようになるまでの教育費、アノテーターのマネジメント費もかかります。

また、アノテーションを専門にしている代行サービス会社は、高精度に素早く作業できますが、アノテーションに慣れていない方は作業にかなりの時間を要します。代行を依頼することで、コスト面だけでなく、時間的にもスムーズなAIモデル構築を可能にしてくれるでしょう。

 

 


2. アノテーション代行会社に外注するメリットは?


アノテーション作業を、外部の代行サービスに任せるメリットは、主に以下の3つです。

① AIモデルの精度が上がる
② 開発業務に専念できる
③ 全体コストを削減できる

 

① AIモデルの精度が上がる

AIシステムの開発は、大きく分けると以下の5ステップに分けられます。

1. データ収集
2. アノテーション
3. 学習
4. 評価
5. 実装

アノテーション代行会社には、上記2のアノテーションを任せることが多いですが、1のデータ収集からサービスを提供する代行会社もあります。アノテーションは、手順3の学習をするための材料作りですので、アノテーション作業の質が完成後のAIシステムにとって非常に重要になります。

アノテーションの作業ひとつひとつはシンプルな作業ですが、AIモデルの精度を高めるには段階に応じて精度検証をしたり、結果の偏りに応じて特定データを追加したりする必要があります。

たとえば、自動運転のAIモデルを作る際、歩行者を認識するためのアノテーションでは、さまざまな状況や角度からの歩行者の画像データを集めて、アノテーション作業を行うことが必要です。

このようなデータ量の調整は、アノテーションを専門にしている代行会社の方が迅速な対応を行いやすいです。
そのため、高精度なAIモデルを構築したい場合は、データ選定の段階から、アノテーション専門会社に代行を依頼したほうが良いです。

ただし、上記のケースでは、アノテーション「作業」のみを行っている代行会社の場合は、AIモデルを高精度にするためのアノテーション方法がわかりませんので、アノテーション代行会社の中でも、AI開発ノウハウのあるアノテーション代行会社が良いと言えるでしょう。

ネクストリーマーは、豊富なAI開発実績を活かした、高精度なAIモデルを実現するアノテーションサービスを提供しています。アノテーション代行の依頼を少しでもお考えの方は、無料で相談可能ですので、いつでもご相談ください。

② 開発業務に専念できる

アノテーション業務の代行を依頼することで、会社内のAI人材がAIの開発業務に専念できます。例えば、アルゴリズムの選定やモデルの改善といった、開発知識を必要とする作業に注力することが可能になります。
社員がよりAI開発に直結した作業に集中できるため、精度の高いAIモデルの構築やプロジェクト全体の期間の短縮化も期待できます。




③ 全体コストを削減できる

アノテーションを専門に行う代行会社は、熟練したスタッフが効率的なツールを使い、短納期で大量のアノテーションデータを作成できます。もちろん、代行の依頼には費用がかかりますが、トータルでは内製するよりもコストが下がることが多いです。
内製では、専門の代行会社に比べて作業スピードが落ちてしまうだけでなく、教育費や人件費がかかるためです。
作業スピードは、アノテーションに慣れている作業者の方が効率よく作業できることは容易に想像できるかと思います。

また、AIモデルを評価した際に、データの偏りが発覚した場合など、どのようなデータを足すべきなのかや、どのラベルの追加アノテーションを行うべきなのかなどは、ノウハウのある方でなければすぐに導くことが難しいでしょう。

このように、アノテーションに慣れていない方は一つ一つの作業に時間がかかってしまうだけでなく、検討にも時間を要します。そのため、代行を依頼したほうが効率的に仕事を進めることができ、結果的に全体コストを削減することができると言えるでしょう。

 

 

3. アノテーション代行会社の選び方


アノテーション代行会社をどのような観点で選べばよいのかを解説します。


得意分野がマッチしているか

一言にアノテーションと言っても、画像、動画、音声、テキスト、どのようなデータにアノテーションするのかによって、アノテーション方法が大きく異なります。

例えば、音声アノテーションでは、音声をテキストに変換したり、感情をラベリングしたりするスキルが求められます。また、複雑な動画アノテーションや自然言語を扱う音声アノテーションは高度なスキルが必要です。

アノテーションサービスを提供するほとんどの代行業者は、基本的にどの分野も取り扱っています。それでも、得意分野でないデータを任せてしまうと、思い通りの成果が出ない場合があります。
アノテーションの代行を依頼する分野が、その企業の強みとなっているかどうかを確認するようにしてみてください。


予算内に収まるか

同じアノテーション作業をするにしても、代行会社によっては単価が異なります。例えば、一般的な画像アノテーションであるバウンディングボックスを例にすると、以下のような差があります。

企業名 1枚あたりの価格
F社 8円
A社 5円
T社 7円

サービスを提供する代行会社によって1枚当たりの価格が異なるのは、アノテーターの雇用条件やツールの準備状況、アノテーターへの依頼方法等によるものです。そのため、自社の求める要件での相場を知りたい場合は、複数のアノテーション代行会社に見積もりを出してもらい比較する必要があります。


ただし、価格だけで選ぶと、結果的にアノテーション品質が悪く、精度の低いAIモデルになる可能性があります。品質とコストのバランスを考慮しておかないと、後からデータを追加したり、データを入れ替えたりする必要がでてくるかもしれません。対象物が多い、或いは複雑な画像の場合、結果的によりコストが高くなる可能性もあります。



人材・体制・ツールがそろっているか

品質に関して確認したい項目は、主に以下の3つです。

1. 利用しているアノテーションツール
2. チェック体制(シングル・ダブル)
3. アノテーション作業者(品質)

アノテーション代行会社によって、アノテーションツールやチェック体制は大きく異なります。例えば、アノテーションツールには、自動アノテーション機能を持つものや言語に特化したもの、クラウドベースで大量のデータを効率的に扱えるものなど、各種の特性があります。


また、アノテーション代行会社が利用しているツールやチェック体制(シングル・ダブル)によって品質も変わります。ダブルチェック体制の方がシングルチェックよりも一般的に品質が高いとされています。チェック体制がシングルチェックであれば、ダブルチェックよりも品質が劣る傾向にあるため、他が同じ条件であればダブルチェックを選択するべきです。

もちろん、どのようなスタッフがアノテーションを行っているのかも重要なポイントになります。アノテーション作業は、経験の少ない人が行ってしまうと品質が下がります。
特に、安価が売りのアノテーション代行会社では、ほぼ経験のないクラウドワーカーにアノテーションを依頼している場合もあります。
そのような場合、アノテーション品質も悪くなり、その結果としてAIの精度に影響する可能性がありますので、どのようなスタッフがアノテーションを行っているのかを確認するようにしましょう。


セキュリティ体制は整っているか

アノテーションを行うデータには、企業秘密や個人情報などの重要な情報が含まれていることがあります。そのため、アノテーション代行会社の選定の際には、セキュリティ体制が整っているかをチェックする必要があります。

特に、アノテーションをするデータ自体に企業秘密などの重要情報がある場合は、管理体制は注意したいポイントです。
クラウドベースのアノテーションツールを使用している場合、データの保存場所やデータ転送時の暗号化などのセキュリティ対策が施されているかを確認することも重要です。

社外のクラウドワーカーにアノテーションの代行を依頼している場合、社内情報が外部に漏れる可能性があります。漏洩リスクを下げるためにも、どのような業務委託契約が締結されているのかなど、セキュリティ体制は必ず確認するようにしましょう。



4. まとめ|アノテーション代行会社は目的に応じて選ぼう


本記事では、アノテーションの代行を依頼することはできるのかや、アノテーション代行会社の選び方について解説してきました。
AI人材とツールが既にそろっているのであれば、自社内で完結する内製も可能かもしれません。しかし、アノテーションは特定の知識と技術を必要とする作業であり、特に大量のデータを効率よく処理するためには、専門的なツールや経験が重要となります。

多くのケースでは専門のアノテーション会社に作業の代行を依頼することが、時間とコストの観点で有利でしょう。
ただし、代行を依頼する場合でもコストだけでアノテーション代行会社を選んでしまうと、データの品質や精度に問題が生じ、結果的に有効なAIモデルを構築できない可能性があります。

品質保証、セキュリティ体制、得意分野など、幅広い観点からアノテーション代行会社を評価し、プロジェクトの目的に最も適した代行会社を選びましょう。