【OpenCV入門最終回】Webカメラでリアルタイム顔検出！動く映像をPythonで解析しよう 📸

8月 19, 2025

「写真の顔が検出できたけど、これをリアルタイムの動画でやるにはどうすればいいの？」
「PythonでWebカメラの映像をどうやって扱えばいいんだろう？」
「自分の顔にリアルタイムで四角い枠が付いてくる、みたいなアプリを作ってみたい！」

こんにちは！ OpenCV探検隊、隊長のPythonistaです！前回の第2回では、学習済みモデル（ハールカスケード）を使い、静止画像の中から人間の顔を検出するという、画像認識の核心的な技術をマスターしましたね。

シリーズ最終回となる今回は、その集大成として、これまで学んだ知識を**リアルタイムの動画**に応用します！この記事のゴールは、PCに接続されたWebカメラの映像を取得し、そこに映る顔をリアルタイムで検出し続けるアプリケーションを開発することです。静的な「画像」から、動的な「映像」へと次元を上げることで、コンピュータビジョンの可能性が無限に広がることを実感できるはずです。さあ、あなたのプログラムに命を吹き込みましょう！

1. 基本的な考え方：「動画」は「静止画の連続」である

「リアルタイムの動画処理」と聞くと、何か特別な、難しい技術が必要に思えるかもしれません。しかし、基本的な考え方は非常にシンプルです。

動画とは、結局のところ、たくさんの静止画（フレーム）がパラパラ漫画のように高速で連続表示されているものです。

つまり、リアルタイムの顔検出を実現するための処理の流れは、以下のようになります。

Webカメラから、その瞬間の映像を**1フレームだけ**キャプチャする。
その1枚のフレーム（静止画）に対して、前回学んだのと全く同じ顔検出処理を適用する。
顔に四角を描画した、処理済みのフレームを画面に表示する。
上記1〜3の処理を、プログラムが終了するまで超高速で**無限に繰り返す**。

これだけです！あなたは既に、この処理の最も重要な部分をマスターしているのです。

2. ステップ1：OpenCVでWebカメラにアクセスする

OpenCVを使えば、Webカメラへのアクセスは驚くほど簡単です。cv2.VideoCapture()という関数を使います。

import cv2

# Webカメラに接続する。引数0は、PCに内蔵されたデフォルトのカメラを意味する
# USBカメラなどを接続している場合は、1, 2, ... と数字が変わる場合がある
cap = cv2.VideoCapture(0)

# カメラが正常に開けたかチェック
if not cap.isOpened():
    print("エラー: Webカメラを開けませんでした。")
    exit()

# 無限ループで、カメラからフレームを1枚ずつ読み込む
while True:
    # cap.read()は、2つの値を返す
    # ret: フレームが正しく読み込めたかどうかの真偽値 (True/False)
    # frame: 読み込んだフレームの画像データ (NumPy配列)
    ret, frame = cap.read()
    
    if not ret:
        print("エラー: フレームを読み込めませんでした。")
        break
        
    # 読み込んだフレームをウィンドウに表示
    cv2.imshow('Webcam Live', frame)
    
    # 'q'キーが押されたらループを抜ける
    # waitKey(1)は、1ミリ秒キー入力を待つ。& 0xFF はおまじない
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# --- ループ終了後の後片付け ---
# 1. カメラを解放する
cap.release()
# 2. 全てのウィンドウを閉じる
cv2.destroyAllWindows()

【重要ポイント】 ループが終わった後、cap.release()でカメラを解放するのを忘れないでください。これを忘れると、他のアプリケーションがカメラを使えなくなってしまうことがあります。

3. ステップ2：リアルタイム映像に顔検出ロジックを統合する

Webカメラの映像をループで取得できるようになったので、あとは前回作成した顔検出のコードを、このループの中に組み込むだけです。

完成版スクリプト

前回と同様に、学習済みモデルhaarcascade_frontalface_default.xmlファイルが、スクリプトと同じディレクトリにあることを確認してください。

import cv2
import sys

# --- 準備 ---
cascade_path = 'haarcascade_frontalface_default.xml'
face_cascade = cv2.CascadeClassifier(cascade_path)
if face_cascade.empty():
    print("エラー: カスケードファイルを読み込めませんでした。")
    sys.exit()

# Webカメラに接続
cap = cv2.VideoCapture(0)
if not cap.isOpened():
    print("エラー: Webカメラを開けませんでした。")
    sys.exit()

print("リアルタイム顔検出を開始します...'q'キーで終了します。")

# --- メインループ ---
while True:
    # 1. フレームを1枚キャプチャ
    ret, frame = cap.read()
    if not ret:
        break
        
    # 2. 処理のためにグレースケール化
    gray_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    
    # 3. 顔検出を実行
    faces = face_cascade.detectMultiScale(gray_frame, scaleFactor=1.1, minNeighbors=5)
    
    # 4. 検出した顔を矩形で囲む
    for (x, y, w, h) in faces:
        # オリジナルのカラーフレームに矩形を描画
        cv2.rectangle(frame, (x, y), (x+w, y+h), (0, 255, 0), 2)
        
    # 5. 結果を表示
    cv2.imshow('Real-time Face Detection', frame)
    
    # 'q'キーで終了
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# --- 後片付け ---
cap.release()
cv2.destroyAllWindows()
print("プログラムを終了しました。")

このスクリプトを実行すると、Webカメラの映像が表示されたウィンドウが開き、そこに映ったあなたの顔が緑色の四角で囲まれるはずです！顔を動かしたり、近づいたり遠ざかったりして、リアルタイムに追従するか試してみてください。

まとめ：OpenCV入門シリーズ、堂々完結！

3回にわたるOpenCV入門シリーズ、お疲れ様でした！このシリーズを通して、私たちは以下の壮大な冒険をしました。

第1回: 画像を読み書きし、簡単な加工をする「目」と「手」を手に入れた。
第2回: 静止画像から顔を見つけ出す「認識能力」を手に入れた。
そして今回: それらの能力をリアルタイムの映像に適用し、動く世界と対話する「生命」をプログラムに与えた。

これで、あなたはコンピュータビジョンの基本的な考え方と、OpenCVを使った実践的なプログラミングの第一歩を完全にマスターしました。

次なる冒険へのヒント

OpenCVの世界は、ここからさらに奥深く、エキサイティングになっていきます。次にあなたが挑戦できるテーマは無限にあります。

他の物体検出: OpenCVは、顔だけでなく「目」や「笑顔」、全身、さらには「猫の顔」を検出するための学習済みモデルも提供しています。
物体追跡 (Object Tracking): 一度検出した物体を、次のフレームでも見失わないように追いかけ続ける技術。
顔認証 (Face Recognition): 検出した顔が「誰」なのかを識別する、さらに高度な技術。

このシリーズで得た知識と自信を元に、ぜひあなた自身のアイデアで、新しい画像認識プロジェクトに挑戦してみてください！

これまでの探検、ありがとうございました！ Happy Vision Programming! 👁️

その他の投稿はこちら

このブログを検索

0から始めるPython