AI構築を行う上で重要となるアノテーションを外注する場合、国内企業(オンショア)か海外企業(オフショア)のどちらかを選択する必要があります。
アノテーションとは、テキスト・音声・画像などのデータに対してタグを付け、AIが学習可能な状態にする作業のことです。アノテーションによりデータにタグを付けることで、AIが学習可能な状態とします。
アノテーション作業では、データに付与するタグの精度はもちろん重要となりますが、外注先の企業とのコミュニケーション等、効率的に作業を進めるために重要となる要素が存在します。本記事では、オンショアとオフショアのメリット、デメリットを紹介すると共に、アノテーションの観点からオンショアとオフショアのどちらの企業に外注すると良いかを紹介します。
【目次】 |
アノテーション作業を外注する場合は、オンショアかオフショアのどちらかを選択する必要があります。
アノテーションの精度は、できあがったAIの精度に深く関わってきます。多くの場合、アノテーションは人の手で行われるので、データ量次第では多くの人員と工数を要するでしょう。
外注によりアノテーションを行うことで、人員と工数を削減しつつ品質の良いデータを取得することができます。
まずは、オンショアとオフショアについて解説します。
オンショアとは、外注またはアウトソーシング先が同じ国や地域であることを指します。
文化やタイムゾーンが同じであるため、コミュニケーションが取りやすく、緊急時においても、アクセスが容易なため、対応可能な業務が多いです。また、業界が同じなため、貴社のニーズに合わせた提案をしてくれる場合もあります。ただし、オフショアの企業と比較するとコストが高くなること多いです。
オフショアとは、外注またはアウトソーシング先が海外にある場合を指します。
オフショアでは、人件費や材料費が安価な国に発注することでコストを抑えることが可能になります。海外の様々な人材に仕事を依頼することができ、海外市場の開拓にもつながる場合があります。依頼する際は、文化体系とタイムゾーンの違いに注意する必要があり、特に業務の細かい箇所をコントロールすることが難しい傾向にあります。
メリット | デメリット |
|
|
それぞれのメリット、デメリットについて説明します。
アノテーションを行う際に重視すべき点は、アノテーションの基準を明確にすることとコミュニケーションが取れる環境づくりが挙げられます。
オンショアの企業に依頼する場合、アノテーションにおいて重要となる基準を明確に決めることができます。
たとえば、画像に写っている人間の位置を検出するAIを開発したい場合、学習データとして画像内に写っている人間の位置を示す四角形の頂点が必要となります。四角形の位置を頭の天辺から足のつま先までにするか、上半身のみするかを目的に合わせて決定しておくことで、品質の高いデータが生成できます。
アノテーションの基準が明確でない場合、目的とするAIからずれた学習データが生成されてしまい、品質の低いデータとなってしまいます。
関連記事:アノテーションにおけるルール整備の重要性 ~具体例やポイントを紹介~ |
アノテーションを行う際に重視すべき点は、<strong>コミュニケーションが取れる環境づくり</strong>が挙げられます。企業によっては目標とするAIを相談することで、アノテーションの基準を決めてもらうこともできるため、AIの専門的な知識が無い場合でも、依頼することが可能となります。
また、判断の難しいデータが出てきた場合も、素早くコミュニケーションを取り、対応を協議することが可能です。
明確な基準を設けていた場合でも、アノテーションを進めていると作業する人がタグの付け方が判断できないようなデータが出てくる場合があります。人間を検出するAIの場合では、人同士が重なっており、基準が見えない等が挙げられます。
判断できないものについては、作業する人が勝手にアノテーションを進めてしまうとデータの品質が低くなる可能性があるので、すぐに相談できる環境を用意しておくことが重要となります。
国内企業に依頼するため、初期費用は高くなってしまいします。一方で、作業者とのコミュニケーション不足による 手戻り等は起きにくいので 、追加 費用が発生することは少ないです。
関連記事:アノテーションの費用・相場は?費用を抑えるコツや外注時の注意点を解説!
メリット | デメリット |
|
|
それぞれのメリット、デメリットについて説明します。
オンショアの企業に依頼するより初期費用を安くすることができます。オフショアには、海外市場開拓という副次的なメリットもあります。
アノテーションにおいて重要となる基準の選定や問題点への対処が、オフショアの企業に依頼した場合は、言語の壁があるので難しくなります。基準を細かく決めることがデータの品質に関わりますので、これらのデメリットはAIの精度に大きく関わってきます。
基準がうまく伝わっていないと手戻り等の問題が発生する可能性があり、初期費用以上のコストがかかってしまうことがありますので、依頼する際は注意してください。
オンショア | オフショア | |
初期費用 | × | ◯ |
コミニュケーション | ◯ | × |
問題点への対処 | ◯ | × |
手戻り | ◯ | × |
オンショアアノテーションは、初期費用が高くなりますが、オフショアと比較してコミュニケーションが取りやすいです。アノテーション基準の決定や変更をスムーズに行うことができ、手戻りの可能性を低くすることができます。
オフショアアノテーションはコミュニケーションが取れる環境を作りづらいので、基準の決定や問題への対処が難しく手戻りの発生確率はオンショアと比較して高くなります。手戻りが発生した場合は、オンショアよりも費用が高くなる場合もあるので注意が必要です。
オフショアアノテーションとオンショアアノテーションについて紹介しました。
それぞれのメリットデメリットは以下のようになります。
メリット ・アノテーションの基準を明確に決めることができ、相談することも可能 ・問題点が出た場合に、早急に対応が可能 デメリット ・初期費用が高い |
メリット ・初期費用が安い デメリット ・言語の違いからアノテーションの明確な基準の決定や相談が難しい ・問題点が出た場合の対処に時間がかかる |
基本的には、コミュニケーションコストを抑えつつ、高品質なデータを入手できるオンショアアノテーションをお勧めします。どうしても初期の費用を抑えたい場合はオフショアアノテーションを利用すると良いですが、コミュニケーションできる環境づくりに注意してください。