人工網膜により、中音域の知覚と符号化が可能になります。
脳を模倣した新しいコンピューティング システムの開発を進める中で、シンガポールと中国の研究者は、中赤外線 (MIR) を放射する物体の知覚と認識のための人工網膜デバイスを考案しました。 人間の視覚の仕組みからインスピレーションを得たニューロモーフィック デバイスは、医療診断、自動運転、インテリジェントな暗視、軍事防衛にとって重要な技術である、より優れた MIR マシン ビジョンへの一歩となります。
現在の赤外線マシン ビジョンは、感覚ユニットと処理ユニットを物理的に分離しているため、大量の冗長データが作成されます。 これは、コンピューティング効率とエネルギー効率が低下するため、理想的ではありません。 対照的に、人間の視覚感覚系は非常に効率的であり、脳が受け取る視覚データ (脳の受信量の 80% 以上) を知覚して処理するコンパクトな網膜を備えており、視覚データは脳の視覚野に送信されてさらなる処理が行われます。 網膜の光受容体は連続的な光刺激を受け取り、それが電位に変換され、後者はスパイクと呼ばれる一連の電気パルスに符号化されます。 その後、刺激情報を含むスパイク列が視覚野に伝わります。
シンガポールの南洋理工大学の Fakun Wang 氏と Fangchen Hu 氏は、生物学的網膜にインスピレーションを得て、同僚とともに 2D ファンデルワールスヘテロ構造に基づく光電子網膜を発明しました。 このヘテロ構造は、テルル化モリブデン (MoTe2) の層の上にある黒ヒ素リン (b-AsP) の層で構成されています。 これらの材料は、光に対する素早い応答と高い吸収効率を理由に選択されました。
これまでの研究は、可視および近赤外線(NIR)波長の光に敏感なニューロモーフィックデバイスの開発に焦点を当てていました。 この研究は波長範囲を中赤外まで拡張します。 この最新の研究のもう 1 つの重要な新しさは、エンコード機能が電気的ではなく光学的に駆動されていることです。これにより、高速動作が期待できます。
MIR レーザー パルスと同時に適用されるプログラム可能な NIR レーザー パルスは、情報をスパイク列にエンコードします。 確率的 NIR パルスはデバイス内の MIR 励起電流を変化させ、電流がしきい値を超えるとスパイクが生成されます。 これは人間の網膜のエンコーディングをエミュレートします。 このデバイスは、100 kHz の NIR パルス周波数に対しても安定した光応答を示し、高精度の MIR 強度コーディングを保証します。
インテリジェント システムのもう 1 つの重要な機能は適応です。 視覚環境に適応するために、MIR ビジョン システムは、MIR 強度の広い動的動作範囲と、高いエンコード精度を備えている必要があります。 研究者らは、MIR レーザーで照射された 9 つの中空の数字「3」を備えた金属マスクを使用してデバイスをテストしました。 これは、組織サンプルなどの実際の MIR ターゲットを模倣するために使用されました。 彼らは、エンコードされた画像が 97% 以上の精度で元の画像と一致する、優れたエンコード精度を発見しました。 研究チームはまた、NIRパルスパラメータを使用して動的動作範囲と精度を制御できることも示しました。
人工の目は人間の視覚を超える可能性を秘めています
さらに、彼らはデバイスを、スパイキング ニューラル ネットワークと呼ばれる、最も効率的で脳に似た人工ニューラル ネットワーク (ANN) の 1 つと考えられているものに接続しました。 このANNでは、脳と同様に、ニューロンは情報伝達体としてスパイクを送受信することによって通信します。 彼らはこのシステムを使用して、画像処理システムのトレーニングに使用される MNIST データセット内の数値の MIR 画像を分類し、96% を超える精度を達成しました。
研究を主導したWang氏は、同社の人工網膜はCMOS技術と互換性があると述べ、研究を進めるための2つの方法を提案している。「1つは、このデバイスにメモリ機能を統合するなど、デバイスの機能を改善して、知覚、符号化、記憶、処理です。もう 1 つは、デバイスを導波ナノフォトニクスと組み合わせて、動作速度の高速化とエネルギー消費の削減を実現することです。」
この研究は Nature Communications に記載されています。