画像認識

読み: がぞうにんしき

画像認識は、デジタル画像や映像からパターン、オブジェクト、文字、顔などを自動的に識別・分類する技術です。機械学習やディープラーニングの発展により精度が飛躍的に向上し、自動運転、医療画像診断、顔認証、OCR など幅広い分野で実用化されています。

QR コードのスキャン (デコード) は、画像認識の特殊なケースです。カメラが撮影した画像から QR コードを検出し、データを抽出するプロセスは、以下のステップで進みます。まず、画像全体からファインダーパターン (3 つの正方形の位置検出パターン) を探索します。次に、ファインダーパターンの位置関係から QR コードの傾きと歪みを計算し、射影補正を行います。補正後の画像をグレースケール変換し、二値化してモジュールの白黒を判定します。最後に、データ領域のモジュール配列をデコードして元のデータを復元します。

最新のスマートフォンでは、この一連の処理がリアルタイムで実行されます。カメラのプレビュー画面に QR コードが映った瞬間に認識が完了し、ユーザーがシャッターボタンを押す必要すらありません。この高速な画像認識は、専用のハードウェアアクセラレーター (Neural Engine、Tensor Processing Unit) によって支えられています。

画像認識

共有する