생성형 AI관제, 지능형 CCTV관제와 무엇이 다른가? (이석중 대표 / 라온피플)

<잇(IT)터뷰 전체 영상 보기>

잇(IT)터뷰 전체 내용은 ▼아래 영상▼에서 확인해 주세요!
게스트 : 이석중 대표이사 / 라온피플 (mdcho@laonpeople.com)
진행자 : 고우성 PD / 토크아이티 (talkit@talkit.tv, https://talkit.tv/)

 
 

영상 목차

 

◼ 아래 각 목차를 클릭하시면 해당 내용을 영상으로 바로 보실 수 있습니다.
단순 감지 vs 맥락 이해
사고 예방
운영 복잡성 vs 직관적 운영
데이터 레이블링 vs 제로샷 러닝
기존 관제 마이그레이션 방안

 


<잇(IT)터뷰 – 핵심 내용 파악하기>

‘잇(IT)터뷰 – 핵심 내용 파악하기’는 영상의 핵심 내용을 정리한 글입니다.
영상 내용을 정리된 글로 확인해 보세요!
더 많은 내용이 궁금하시다면 페이지 상단의 영상이나 하단 영상 링크를 클릭하여 확인해 주세요!
이번 잇(IT)터뷰는이번 잇(IT)터뷰는 생성형 AI가 CCTV 관제에 결합되면서 “사람/객체를 찾는 단순 감지”를 넘어 “상황의 맥락을 이해하고 위험을 설명하는 관제”로 진화하는 흐름을 정리합니다.
또한 제로샷·퓨샷 기반 탐지로 레이블링과 재학습 부담을 줄이고, 기존 CCTV는 그대로 두고 서버(두뇌)만 교체하는 방식으로 현실적인 마이그레이션이 가능하다는 점을 구체적으로 설명합니다.

 
 

1. 단순 감지 vs 맥락 이해: CCTV 관제의 핵심 차이

 

기존 CNN 기반 지능형 관제는 “여기 개가 있냐/사람이 있냐”처럼 객체 검출은 잘하지만, 사람들이 관제에서 정말 알고 싶은 “행위”는 잘 잡기 어려웠다.
예를 들어 “승인받지 않은 사람이 캐셔(계산대)에 손을 댄 상황이면 알람을 올려라” 같은 요구는 기존 방식으로 구현이 어려웠다.

 
단순 감지 vs 맥락 이해

 

생성형 AI 관제는 언어 능력과 비전 이해 능력을 결합해, 단순히 누워 있다는 장면 검출에 그치지 않고 “통증을 호소하며 쓰러진 상황”과 “청소/작업 때문에 잠깐 누운 상황”처럼 맥락 차이를 구분해 다른 조치를 내릴 수 있다.
이 관점에서 생성형 AI 관제는 ‘상황을 읽고 설명하는 관제’로 정의된다.

 
 

2. 사고 감지에서 사고 예방으로: 관제 데이터의 활용 범위 확대

 

CCTV가 맥락을 이해하면, “사고가 났다”를 감지하는 수준을 넘어 “사고가 날 뻔한 상황(near-miss)”을 찾아낼 수 있다.
교통사고는 통계가 잡히지만, 사고 직전의 위험 장면은 통계로 남지 않는 경우가 많다. CCTV 데이터에서 이런 near-miss를 추출할 수 있으면 교통 시스템 개선과 시민 안전 측면에서 의미 있는 인사이트가 나온다.
산업 현장 안전에서도 같은 논리로 “사고가 날 뻔한 상황”을 찾아 안전을 강화하는 데 활용할 수 있다.
또한 실시간 관제뿐 아니라, 이미 쌓인 영상 데이터에서 중요한 장면을 빠르게 추출하는 방식으로도 가치가 크다.

 
 

3. 검색/분석 속도의 변화: “수시간 걸리던 작업을 수초로”

 

기존 방식으로 영상에서 특정 장면을 찾으려면 후보 이미지를 많이 뽑아낸 뒤 수동 필터링이 필요했다.
하지만 생성형 AI 기반 관제에서는 “빨간 모자 쓴 사람이 가방을 두고 갔다”처럼 자연어로 조건을 주면 후보가 크게 줄어, 수시간 걸리던 작업을 수초 단위로 줄일 수 있다는 설명이 나온다.

 

운영 복잡성 vs 직관적 운영
 
 

4. 운영 복잡성 vs 직관적 운영: 프롬프트로 바로 바꾸는 관제

 

CNN 기반 관제는 검출 모드를 바꾸려면 보안 업체에 요청하고, 일정 조율 후 변경하는 식으로 운영이 번거롭다.
반면 생성형 AI 관제는 현장에서 말로 하거나, 프롬프트/채팅창에 입력하는 것만으로 탐지 조건을 즉시 바꾸는 운영이 가능하다고 정리한다.
이 변화는 운영 측면에서 “유지보수 비용 증가 → 단순화” 방향으로 의미가 있다.

 
 

5. 데이터 레이블링 vs 제로샷 러닝: 학습하지 않은 상황도 대응

 

기존 방식은 “학습하지 않은 행동은 검출이 불가능”하고, 상황이 바뀔 때마다 데이터 수집 → 레이블링 → 재학습 → 배포를 반복하게 된다.

 

데이터 레이블링

 

예를 들어 종업원 유니폼 색이 바뀌는 것 같은 작은 변화도 재학습을 요구하는 구조가 되어 유지보수 비용과 운영 부담이 커진다.
생성형 AI 모델은 방대한 웹 데이터를 학습해 이미 지식을 갖추고 있어, 많은 경우 제로샷 또는 퓨샷으로 탐지가 가능하다고 설명한다.
제로샷으로 어려운 경우에도 이미지 몇 장을 추가해 퓨샷 방식으로 보완하면, 기존에는 불가능했던 탐지가 가능해진다는 흐름이다.

 
 

6. 기존 관제 마이그레이션 방안: CCTV는 그대로, “두뇌(서버)”만 교체

 

기존 CCTV 인프라를 바꾸기 어렵다는 현실을 전제로, “CCTV는 눈이니 바꿀 필요가 없고, 뇌를 바꾸면 된다”는 메시지가 나온다.
즉 카메라/네트워크는 유지하고 서버 중심으로 교체하면 마이그레이션이 과도하게 복잡해지지 않는다.
다만 보안/관제 영역은 보수적이기 때문에, 실제 도입에서는 보통 2~3개월 정도의 PoC를 거치고 고객별 요구사항을 맞추는 과정이 필요하다고 정리한다.

 
 

7. 3줄 요약 (핵심만)

 

– 생성형 AI 관제는 기존 CCTV 관제의 “객체 감지”를 넘어 “맥락 이해와 위험 설명”까지 수행한다.
– 제로샷·퓨샷 탐지로 레이블링/재학습 부담을 크게 줄이고, 프롬프트로 탐지 조건을 즉시 바꾸는 직관적 운영이 가능하다.
– 기존 CCTV는 유지하고 서버(두뇌)만 교체하는 방식으로 현실적인 마이그레이션이 가능하며, 도입은 PoC와 고객 맞춤 과정을 거친다.

 

◼ 전체 잇(IT)터뷰 내용은 ▶영상으로 바로 가기(클릭)◀에서 확인하실 수 있습니다.
◼ 아래 각 목차를 클릭하시면 해당 내용을 영상으로 바로 보실 수 있습니다.
단순 감지 vs 맥락 이해
사고 예방
운영 복잡성 vs 직관적 운영
데이터 레이블링 vs 제로샷 러닝
기존 관제 마이그레이션 방안

◼ 콘텐츠 & 웨비나 문의 : marketing@talkit.tv, 02-565-0012
Copyright ⓒ 토크아이티 All rights reserved. 무단 전재 및 재배포 금지.