AIを活用することで、目的とする文献を検索結果の上位に表示させることによって、特許文献調査を効率化できる可能性が示唆されている。しかし、特許文献調査の補助的なツールとしての利用にしても、精度の高い調査をできるか、本当に省力化できるのかの検証や開発の段階と思われる。
特許と人工知能(AI)に関する動きをまとめてみた。
特許庁では、平成28年度から、人口知能(AI)の活用を検討している。
そして、現在は、特許分類付与(テキストに基づく付与)と先行技術調査(検索式作成支援、画像検索技術の特許図面への適用)の導入に向けて、精度・費用対効果確認のフェーズにあるという(https://www.jpo.go.jp/system/laws/sesaku/ai_action_plan/document/ai_action_plan/01.pdf https://www.jpo.go.jp/system/laws/sesaku/ai_action_plan/document/ai_action_plan-fy30/plan.pdf)。
また、発明の内容理解・認定や特許登録可否の判断については、具体的なアクション・プランにはないが、AI技術の進展を注視するとして、各種の知財インテリジェンスサービスの紹介を行っている(https://www.jpo.go.jp/support/general/ip-intelligence/index.html)。
特許情報解析へのAIの利用については、『情報の科学と技術』2017年7月号 (67巻7号)で特集が組まれ(https://www.jstage.jst.go.jp/browse/jkg/67/7/_contents/-char/ja)、さらに2018年7月号でも特集が組まれた(https://www.jstage.jst.go.jp/browse/jkg/68/7/_contents/-char/ja)。
『情報の科学と技術』の2つの特集号の内容をもとに、AIを活用した特許文献調査、特に無効資料調査の現状について見てみることにする。
2018年の特集号の中の、野崎篤志さんの『特許情報と人工知能(AI):総論』には、AIを用いた特許調査・分析ツールについての現状と将来予測が書かれている(https://www.jstage.jst.go.jp/article/jkg/68/7/68_316/_pdf/-char/ja)。
現状は、『現在世の中に出ているのは,人間の行う理解や判断の一部を置き換えるAIであり,AI搭載型ツールは特許調査・分析の一部タスクにのみ適用可能であるため「弱いAI 」(または「特化型 AI」)である。』ということである。
前提として留意すべきは、以下の2点であると書かれている。
1.AIツールを賢くするのは人間
2.AIツールは作業効率化・省力化するための道具
1の『AIツールを賢くするのは人間』は、『機械学習であっても,ディープラーニングであっても教師データが必要かつ重要であり,人間が行わなければならない。という意味である。
また、2の『AIツールは作業効率化・省力化するための道具』は、『AIツールで得られた結果を人間がチェックせずにそのまま利用できるか?というと,特許情報業務のほとんどを占める非定型業務においては,AIツールは従来の作業を効率化・省力化するための道具として捉えた方が良い。』と補足されている。
野崎さんの論文の中の特許調査に関する部分を抜き出してみた。
特許調査について、各ステップごとに「AI化されるか,人間が行うべき業務か,または AI と人間が協働して行うべき業務か」が評価されている。
抜き出してみると、
2)調査ポイントの設定・分析範囲の設定;人間
3)検索式作成・母集団形成:人間+AI
4)公報スクリーニング;AI+人間(検討済/製品あり)
5)抽出公報の判断(新規性・進歩性など);AI+人間(検討済/製品あり)
検討済で製品ありとなっている(4)と(5)の説明を見てみる。
(4)公報スクリーニング
『検索式作成について,先行技術調査においては「検索式作成・母集団形成」を行うことが究極的に不要になり,過去発行文献すべてを母集団として調査を行うようになると著者は予想している。教師データを与えてスコア上位 10~50 件程度を読んで調査を完了するというイメージである。ただしこのような運用にするか否かは組織次第である。
まずは人間が検索式作成を行う必要があるのだが,その際に AIがサポートできるところとしては,
・関連キーワードや関連特許分類の提案
・再現率を高めるための提案;モレを AIにて判断して,母集団に補足することを期待している。』と書かれている。
また、『あくまでも公報にスクリーニングにかける時間を省力化できることが AI ツールの効果である。』と書かれている。
(5)抽出公報の判断(新規性・進歩性など)
『IP Samurai がこのカテゴリに該当する AI 搭載ツールである。IP Samurai では,特許性の判定を,構成要件と先行文献の類似度をベースに判断している。人間が新規性・進歩性を判断する上でのサポート材料を AI が生成・提案することはあっても,最終的な判断は人間が行わなければならない。』
『IP Samurai は他の AI 搭載ツールとは異なり,図 10 に示すように,発明の新規性・進歩性について請求項または仮想クレームのエレメントごとの特許性の確率を算出して,Patentability Rank を表示するシステムである。現在は USPTO の過去の出願内容や審査経過情報をベースにしている。
IP Samurai の技術的詳細については特許第 6306786 号に開示されており,機械学習により権利取得可能性を算出する。』
と紹介されている(IP Samuraiのホームページ https://aisamurai.co.jp/)。
「情報の科学と技術」の特集号には、特許調査に活用できる市販ツールの紹介があるが、その中に、無効資料調査に活用できる市販分析ツール、「Invalidator」と「Patent Explorer」が紹介されている。
(1) Invalidator
「Invalidator」を紹介した『AI 技術を利用したグローバル特許調査・分析ツール「Xlpat」の活用と可能性』(https://www.jstage.jst.go.jp/article/jkg/68/7/68_343/_pdf/-char/ja)の論文を要約する。
「Invalidator」は、概念検索をベースとし,無効化したい特許番号を入力すると,その文献に類似性の高い文献リストを無効化候補文献として出力する分析ツールとのことである。
使用例として、U.S. Patent No.7,807,799Bに対するInter Partes Review(当事者系レビュー)の審理で、新規性欠如の主引例となったWO95/22389と副引例US6127526が無効化候補文献として出力されるか検証した結果が公開されている。
U.S. Patent No.7,807,799Bは、「Protein Aaffinity chromatography」を利用したたんぱく質の精製法に関する特許である。
検索は、以下の 3 通りを行われた。
ケース 1;特許番号(US7807799)だけを入力。
ケース2;特許番号とキーワードとして「Protein A」及び「Affinity chromatograpy」を設定
ケース 3;特許番号とキーワードとして「Protein A affinity chromatography」(一連の語として入力)を設定
いずれの場合も400件ヒットさせ、WO95/22389 とUS6127526 の有無、ヒットした順位を調べたとのことである。
結果は、
ケース1では,WO95/22389 及びUS6127526 ともにヒットせず。
ケース2では、主引例はヒットせず、副引例は40位でヒット。
ケース3では、主引例が5位でヒット。
これらの結果を受けて、「設定するキーワードが結果に大きく影響している」ことから、
「設定するキーワードによっては良い結果を取得しうる」とし、『1 度も良い結果が得られなければ検討に値しないが,良い結果が取得しうるのであれば,使い道は十分にあるものと思われる。』と書かれている。
また、『「番号入力と適当なキーワード設定」→「上位特許を査読」→「欲しい文献なければ,キーワード設定を変更して再検索」→「上位特許を査読」のサイクルを繰り返すことにより,予備的又は補完的な無効文献調査ができるのではないかと考えられる。』とも書かれている。
(2) Patent Explorer
「Patent Explorer」を紹介した2つの論文、『ビッグデータ時代における特許情報調査への人工知能の活用(https://www.jstage.jst.go.jp/article/jkg/67/7/67_372/_pdf/-char/ja)、『人工知能エンジン「KIBIT」を用いた自然言語処理と特許調査への応用』https://www.jstage.jst.go.jp/article/jkg/67/7/67_360/_pdf/-char/ja)をもとにまとめた。
「Patent Explorer」は、
『①高度な検索式を作成する必要が無い,
②関連性の高いものをスコア順に並べて調査工数を削減する,
③関連性の高い段落を提示するため公報全文を読む必要がない,というメリット』があり、
『特許出願時の先行技術調査や無効化資料調査のスクリーニング』における研究者の調査業務の省力化を狙ったものということである。
分析は、以下のような手順で行われた。
『(1)各特許の請求項1に記載されたテキストを「無効理由に関連する」として KIBIT に学習させる,
(2)母集団に含まれる数千~数万件の文献にスコアを付ける
(3)すべての文献をそのスコアで降順に並べ替える
(4)無効審決の根拠となった無効資料の順位(スコア上位からレビューした場合に何番目で発見できるか)を確認する』。
「Patent Explorer」の検索エンジン「KIBIT」は、『学習用データに基づいてモデルを最適化する「学習」のフェーズと,未知データに対して学習結果を適用する「推論」のフェーズとを経て,そのパフォーマンスを発揮する。』と説明されている。
「学習」フェーズでは、『学習用データ(データを解析する目的に「関連する/しない」を人間が判断した関連ラベル付きデータ)に含まれる文章(テキスト)』を解析し,形態素を抽出、各形態素の特徴付ける度合い(「関連する/しない」の間における出現頻度の偏り)を評価し、定量化すると説明されている。
また、「推論」フェーズは、未知データに含まれる文章を形態素解析し、未知データの「スコア」を算出。『スコアの高いデータは,判断の対象となった事象(例えば,訴訟)との関連性が高いことを示し,低いデータは,関連性が低いことを示す。』と説明されている。
「Patent Explorer」を用いた調査業務の省力化の検証事例として、
「無効審判において新規性なしと判断された事件から考察する精度の高い調査方法」(2014, Vol. 67, No. 1)において、「検索式が不適切である」ことが原因とされた次の 3 つの特許を Patent Explorer で分析し,無効資料の発見効率が調べられている。
事例1 無効2006-080074(特許第3621023号)
IPC「F24F5/00」を指定し,これを含む 5,249 件を母集団。
無効資料(特開 2000-46443号公報)は,上位 31番目にランキング。
事例2 無効2006-080263(特許第 3662815号)
IPC「G03G15/20」または「C08L83/07」を指定し,これを含む 13,079 件を母集団。
無効資料(特開平11-060955号公報)は,上位 8番目にランキング。
事例3 無効2008-800249(特許第 3893292号)
IPC「A61K7/00」または「A61K8/97」を指定し,これを含む 16,033 件を母集団。
無効資料(特開平10-194923号公報)は,上位 19番目にランキング。
これらの結果から、
PatentExplorerは,母集団に対して 1%以上の精度で(1,000件の母集団に対して上位 10位以内に)新規性欠如の根拠となる無効資料を抽出することができたという。
現状では、AIを利用した先行文献調査や無効資料調査は、特許文献に限定されるし、検索でヒットした母集団の上位にランキングされる可能性があるという段階にあると思われる。
そして、AI利用で期待できる効果は、“省力化”であると結論される。しかし、現時点では、精度を高い調査をできるのか、本当に省力化できるかの検証や開発の段階と思われる。
AI利用の可能性について、別の観点からの文献を紹介して本稿を終えることにする。
「AIで弁理⼠が失業」に異議 「そんなに単純な仕事じゃない」 ⽇本弁理⼠会の梶副会⻑
https://www.itmedia.co.jp/news/articles/1711/16/news109.html
先行文献調査は AI にとって替わるのか(20171201104104ATIS「談話室」12月.pdf)
http://www.atis.gr.jp/talk/20171201104104ATIS%E3%80%8C%E8%AB%87%E8%A9%B1%E5%AE%A4%E3%80%8D12%E6%9C%88.pdf