1조-레전두

MIE capstone
Mie202301 (토론 | 기여)님의 2023년 12월 19일 (화) 00:56 판 (개발과제의 기대효과: 글 입력 완료)
이동: 둘러보기, 검색

프로젝트 개요

기술개발 과제

국문 : 침대용 얼굴 추적 거치대

영문 : Face-Tracking Smart Phone Holder on Bed

과제 팀명

레전두

지도교수

신동헌 교수님

개발기간

2023년 9월 ~ 2023년 12월 (총 4개월)

구성원 소개

서울시립대학교 기계정보공학과 20XXXXX0** 정**(팀장)

서울시립대학교 기계정보공학과 20XXXXX0** 공**

서울시립대학교 기계정보공학과 20XXXXX0** 이**

서울시립대학교 기계정보공학과 20XXXXX0** 허*

서울시립대학교 기계정보공학과 20XXXXX0** 최*

서론

개발 과제의 개요

개발 과제 요약

기존 침대용 스마트폰 거치대 이용에는 자세 변경 시 사용자가 직접 위치를 재조정해야 하는 불편함이 있다. 이를 해소하기 위해 카메라를 통해 사용자의 얼굴을 인식하고 이를 바탕으로 자동으로 스마트폰의 위치를 조정해주는 자동 위치 조정 거치대를 개발한다. 라즈베리파이를 통해 MediaPipe 프레임워크를 사용하여 사용자의 눈의 위치를 파악할 수 있도록 하고, 모터드라이버를 통해 서보모터를 제어하여 사용자의 얼굴 방향에 맞추어 거치대가 구동할 수 있도록 한다. 이를 통해 침대에서 휴대폰을 이용하는 사용자가 수동 조정이 따로 필요없이 편리하게 스마트폰을 볼 수 있도록 하며, 특히 몸이 불편한 환자나 연세가 있으신 분들에게 휴대폰 사용에 있어서 더욱 편의성을 가져다줄 것으로 기대한다.

개발 과제의 배경

2006년 아이폰의 출시화 함께 스마트 폰이 등장하면서 컴퓨터를 사용해야만 하는 작업이 스마트 폰으로 가능해졌고, 휴대폰은 단순 전화기를 넘어선 ‘만능 기기’로 재탄생했다. 연락, 업무, 은행 등 일상적인 일부터 유튜브, 넷플릭스 같은 스트리밍, 게임까지 다양한 취미생활까지 점령하고 있는 스마트폰은 이제 사람과 밀접한 관계가 되었다.

컴퓨터로만 가능했던 일을 스마트폰에서도 할 수 있게 됨에 따라, 다른 작업과 함께 스마트폰을 이용하거나, 침대에서 사용한다는 등 더 편하게 스마트폰을 이용하기 위한 ‘휴대폰 거치대’가 등장했다. 초기의 거치대는 단순히 수동으로 각도 조정이 가능한 1자유도의 받침대 형태로 등장했다.

Fig1

이후 유연하게 움직이는 팔을 가진 거치대가 출시되었고, 각도를 자유롭게 조절하여 사용자가 원하는 상태로 만들 수 있게 되었다. 이는 여분의 자유도를 추가해 침대에 누워 편하게 스마트폰을 즐길 수 있는 환경을 조성했다.

Fig2

하지만 기존 스마트폰 거치대는 단순 고정 기능만 있을 뿐 자세가 조금이라도 달라지면 위치와 각도를 다시 조절해야 하는 번거로움이 있다. 만약 자주 뒤척이는 사용자가 기존 거치대를 사용하는 경우, 매번 거치대의 각도를 변경해야 하는 큰 번거로움이 있다.

이러한 번거로움을 덜어주기 위해, 자동 조정 거치대를 찾아보면, 사용자의 얼굴을 인식하고 이를 바탕으로 각도를 조정하는 1자유도 자동형 거치대가 존재한다. 하지만 360도 회전하는 1자유도만 가지기 때문에 시선과 정확한 거치대를 맞추기 어렵고, 침대에서 휴대폰을 사용하는 경우가 많다는 점을 고려하면, 누워서 사용하는 것이 불가능하다는 단점이 있다.

Fig3

따라서 본 과제에서는 이러한 기존의 거치대의 단점을 보완할, 침대에서도 사용자가 누워서 편리하게 휴대폰을 사용할 수 있도록 4 자유도를 가지는 자동형 거치대를 제작하고자 한다. 그 이상의 자유도는 설계가 복잡하고 시간적 측면에서 불가능하다고 판단하여 4자유도를 택하였다.

Fig4

얼굴 방향 추출 방식에는 여러가지가 있지만, 접근성이 좋고, 정면이 아닌 경우에도 인식이 가능하며, 라즈베리파이와 같은 모바일 및 저사양 기기에 최적화된 mediapipe 라이브러리를 이용하기로 한다. 기존 기술인 Dlib 라이브러리는 68개의 landmark를 이용하여 사람의 얼굴 특징을 추출하는 방법이였다. 하지만, 낮은 정확도와 동 사양의 기기에서 최적화 부분에서 뒤쳐진 기술이었기에, mediapipe 라이브러리를 사용하기로 결정했다.

Mediapipe 라이브러리에서는 얼굴 추적을 위해 기술적 특성이 약한 장치에 최적화된 BlazeFace 모델을 사용한다. 라이브러리에서 제공되는 face_mesh 추적 기능을 활용하여, 카메라를 통해 촬영한 사람의 얼굴 특징을 파악한다. 특히 BlazeFace을 통해 얻은 468개의 landmark 좌표값 중 눈, 코, 입 주변의 landmark 좌표 값을 통해 현재 사용자 얼굴의 방향을 추정할 수 있다.

최종적으로, 기존의 거치대와 비교하여 현재 개발하려는 face-tracking 스마트폰 거치대의 장점은 다음과 같다.

  • 고개를 상하좌우로 움직이는 것에 맞춰 자동으로 각도를 변경하여 수동 조정이 필요 없다.
  • 4 자유도라는 면에서 기존의 자동형 거치대에 비해서 더욱 향상된 편의성을 가져다준다.

종합하면, face-tracking 스마트폰 거치대는 사용자의 편의성을 증대할 것으로 예상된다. 본 연구에서는 거치대 중에서도, 사용자가 침대에 누워서 휴대폰을 사용할 수 있도록 하는 것에 초점을 두어, ‘침대용 face-tracking 스마트폰 거치대를 만들고자 한다. 이 제품을 통해 사용자는 한 자세로 오래 있어야 하는 불편함을 겪지 않아도 되며, 자세를 바꿀 때 마다 거치대 각도를 조정할 필요가 없으므로 사용자에게 더 큰 편리함을 줄 수 있다.

개발 과제의 목표 및 내용

Fig5

1) 라즈베리파이용 카메라와 MediaPipe라이브러리를 이용한 실시간 사용자 얼굴 방향 추적

본 프로젝트는 실시간으로 사용자의 얼굴을 인식하여 거치대가 사용자의 정면 모습을 추적하게 만드는 기술이 필요하다. 이를 구현하기 위해 라즈베리파이의 환경에서 mediapipe 라이브러리와 BlazeFace 모델의 face_mesh 추적기능을 통해 눈, 코, 입과 같은 사용자의 얼굴 특징들을 인식하고, 얼굴이 현재 바라보는 방향을 추정할 수 있도록 한다. 추출된 데이터를 기반으로 핸드폰 거치대의 위치와 각도를 자동 조정하여 사용자의 얼굴 방향을 따라 움직이게 할 예정이다.

  • OpenCV를 사용하는 이유

OpenCV와 mediapipe라이브러리를 사용하는 이유는 접근성이 좋고, 이미지 처리와 컴퓨터 비전 작업에 필요한 다양한 함수를 제공하기 때문에 복잡한 알고리즘 개발 시간을 절약하고 프로젝트의 효율성을 높일 수 있기 때문이다. 실제로 해당 라이브러리들은 안정성과 성능 면에서 검증되었고, 다른 라이브러리에 비해 확장과 수정이 용이한 것으로 알려져 있다. 또한 OpenCV의 경우 이전 프로젝트에서 사용해본 경험이 있기 때문에, 보다 더 사용하는 데에 있어서 친숙하다는 점을 고려하여OpenCV를 사용하기로 결정했다.

  • 라즈베리파이를 사용하는 이유

라즈베리파이는 Linux 기반의 운영 체제를 지원하여 다양한 소프트웨어와 라이브러리의 설치가 가능하다. 또한, 고해상도 카메라 연결이 용이하여 컴퓨터 비전 프로젝트에 적합하다고 생각하여 라즈베리파이를 선택하였다.


2) 거치대 manipulator 구성

manipulator의 경우 4개의 rotation joint를 지니는 4 DOF 구조의 거치대 제작을 목표로 한다. 4 DOF를 초과하는 manipulator은 제작 및 SW 설계가 어려울 것으로 판단하여 복잡한 매커니즘은 본 연구에서는 따로 고려하지 않기로 한다. 사용자의 머리맡은 고정되어있는 상태에서, 머리만 회전하여 움직이는 상황만을 가정한다.

CATIA로 manipulator의 각 link들을 모델링하고, manipulator 구동상황을 바탕으로 ANSYS FEM tool로 응력해석을 하여 각 link의 내구성을 판단한다. 이 과정을 통해, manipulator 가 문제없이 거치대의 역할을 할 수 있도록 한다. 개략적인 거치대 manipulator 형태 및 구동 양상은 아래 Fig 6 과 Fig 7과 같다.


Fig6 Fig7

3) manipulator의 각도를 조절하기 위한 모터 제어

manipulator의 rotation joint를 구현하기 위해서 각도 제어가 용이한 모터인 서보모터를 사용한다. MediaPipe로 계산된 방향 정보와 모터 구동 사이의 딜레이를 최소화하기 위해 아두이노를 사용하지 않고 모터 드라이버를 라즈베리파이에 직접 연결하여 4개의 모터를 제어한다. 라즈베리파이에서 구한 사용자의 방향과 위치 값을 바탕으로 휴대폰이 점차 사용자 정면 방향에 가도록 제어한다. 방향 정보에는 카메라에 대한 사용자 얼굴의 roll, pitch, yaw 값과 사진 상에서의 사용자 코의 위치좌표가 나온다. Roll, pitch, yaw 값은 최소가 되도록, 코의 위치좌표는 사진 중앙에 오도록 제어한다.

관련 기술의 현황

관련 기술의 현황 및 분석(State of art)

  • 전 세계적인 기술현황

1. 휴대폰 거치대

1) 수동 1 자유도 휴대폰 거치대

Fig8

단순히 스마트폰을 받치기 위한 거치대이다. 보통 책상에서 사무 보조 용도로 쓰이며 차량용의 경우 네비게이션 같은 운전 보조 용도로 쓰인다.

2) 수동 다자유도 휴대폰 거치대

Fig9

와이어형의 경우 위치를 자유롭게 조정이 가능해 서있거나 앉아 있지 않은 상태에서도 휴대폰 화면을 볼 수 있다. 우측의 다자유도를 가진 거치대 역시 자유롭게 위치를 조정할 수 있다는 장점이 있다. 두 거치대 모두 휴대폰이 떨어지지 않도록 하는 end effector 쪽 홀더가 필요하다.

3) 자동 1 자유도 거치대

Fig10

1 자유도를 가치고 z축을 기준으로 360도 회전한다. 카메라에서 목표물을 선택하면 움직이는 물체를 따라가는 Smart Track 시스템이 내장되어 실시간으로 물체를 추적해 촬영이 가능하다. 수동으로 x축 혹은 y축 방향으로 일정 각도를 변경할 수 있다.

4) 스마트폰 짐벌

Fig11

촬영을 지원하기 위한 스마트폰 짐벌로, 오토 트래킹 기능을 탑재했다. 타겟이 카메라를 벗어나지 않게 자동으로 3축을 적절하게 움직여 목표물을 자동으로 추적한다.

관련 기술의 특징을 정리하면 다음과 같다.

수동 1 자유도 휴대폰 거치대 수동 다자유도 휴대폰 거치대 자동 1 자유도 거치대 자동 스마트폰 짐벌
사진 사진 사진 사진
장점
* 좁은 공간에서 사용 가능하다 * 홀더의 위치를 자유롭게 조절 가능하다 * 물체를 인식해 자동으로 각도를 조절한다 * 물체를 인식해 자동으로 각도를 조절한다
* 3 자유도를 가져 다양한 각도로 변화가 가능하다
단점
* 좁은 공간에서 사용 가능하다 * 홀더의 위치를 자유롭게 조절 가능하다 * 물체를 인식해 자동으로 각도를 조절한다 * 물체를 인식해 자동으로 각도를 조절한다
* 3 자유도를 가져 다양한 각도로 변화가 가능하다

현재 시장에 있는 휴대폰 거치대를 분석해보면, 목표물을 인식해 회전하는 자동 1자유도 모델을 제외하면 자동으로 각도를 조절하는 휴대폰 거치대를 찾지 못했다.

2. 안면 인식 기술

본 프로젝트에서는 비교적 작고 값싼 임베디드 보드인 라즈베리파이를 사용하기 때문에, 객체탐지 기술 중에서 연산량이 많이 필요한 기술은 활용하기 어렵다. 따라서 본 프로젝트에서는 저사양의 임베디드 보드에서 비교적 적은 연산으로 작동시킬 수 있는 간단한 객체탐지 기술을 활용해야 한다. 이와 관련된 기술 현황들을 소개하고, 성능을 비교하고자 한다.

1) OpenCV

Fig 11

‘OpenCV’는 다른 컴퓨터 비전 라이브러리들과 비교했을 때 몇 가지 강점을 지니고 있다.

  1. Haar Cascade 알고리즘 라이브러리처럼 눈 인식과 같은 특정 작업을 위한 세분화된 도구들이 풍부하게 구비되어 있다.
  2. 실시간 처리에 중점을 두어 이에 최적화된 코드는 빠른 실행 시간을 보장하며, 이는 실시간 얼굴 인식 프로젝트에서 큰 이점이 된다.
  3. 다양한 프로그래밍 언어와 플랫폼에 대한 광범위한 지원은 개발자들이 편리하게 자신의 환경에서 작업할 수 있게 한다.

이러한 특성들로 인해 OpenCV를 이번 프로젝트에서 비전 관련 라이브러리로 사용할 것이다.

2) Haar Cascade

Fig 12

OpenCV의 ‘Haar cascade’는 Paul Viola와 Michael Jones에 의해 2001년에 발표된 객체 인식 알고리즘에 기반을 두고 있다. 이 알고리즘은 이미지 내에서 Haar-like 특징을 신속하게 추출하고, Adaboost를 이용해 유용한 특징만을 선택한 후, cascade 구조를 통해 실시간 객체 인식을 가능하게 하는 방식으로 작동한다.

Haar cascade는 빠른 계산 속도와 간결한 구조를 가진 객체 인식 알고리즘으로, 실시간 애플리케이션에 적합하다. 이미지의 다양한 영역에서 간단한 Haar-like 특징을 효율적으로 추출할 수 있어, 리소스가 제한된 장치에서도 높은 성능을 발휘한다. 또한, 학습 과정이 비교적 단순하며, OpenCV와 같은 라이브러리를 통해 쉽게 구현하고 사용할 수 있다. 그러나 얼굴 정면 사진이 아니면 인식률이 급격하게 떨어진다는 단점이 존재한다.

3) Dlib facial landmark detection

Fig 13

‘Dlib’은 컴퓨터 비전과 기계 학습 분야에서 두각을 나타내는 C++ 라이브러리로, 특히 HOG와 신경망 기반의 고성능 얼굴 탐지기와 68개의 정확한 얼굴 랜드마크 추출 기능을 제공한다. 또한 템플릿 프로그래밍, 광범위한 기계 학습 알고리즘, 선형 최적화 도구, 그리고 Python 바인딩은 사용자에게 유연성과 다양한 활용성을 제공한다. 모듈식 설계와 플랫폼 독립성 덕분에 dlib은 다양한 환경에서 효과적으로 사용될 수 있다. Haar Cascade와 달리 비정면 사진에서도 눈 인식률이 높다는 장점을 지니고 있다.

4) Mtcnn

Fig 14

‘MTCNN’은 상당히 놓은 성능과, 랜드마크를 함께 표시할 수 있기 때문에 중심을 잡는 용도 등 다양한 활용이 가능하다는 장점이 존재한다. 다만 프로젝트 적용에 있어서는 생각보다 많은 자원이 사용되며, 특히 속도상에 이점을 가지기가 어려웠고, 최근 코로나 이후 마스크 착용이 대중화되었는데, 이런 마스크 등의 요인으로 랜드마크를 잘 못 찾는 등의 문제도 발생한다.

5) Mobilenet_ssd

Fig 15

‘SSD’는 One-Stage 종류의 모델로, Region Proposal과 Object Detection을 따로 분리하지 않고 한 번에 수행하는 모델이다. One-Stage 모델은 Two-Stage 모델보다 학습 속도가 빠르기 때문에 자율 주행 차량에서 객체를 빠르게 탐지하기 위해 주로 사용된다. Two-Stage 모델들은 탐지 성능이 뛰어나지만 상대적으로 탐지 속도는 매우 느린 편이다. 따라서 연구자들은 이런 느린 탐지 속도 문제를 해결하고자 One-Stage 모델을 개발하고 있다.

6) Mediapipe

Fig 16

Mediapipe는 구글에서 주로 인체를 대상으로 하는 비전 인식 기능들을 AI모델 개발과 기계학습까지 마친 상태로 제공하는 서비스이다. 다양한 프로그램언어에서 사용하기 편하게 라이브러리 형태로 모듈화 되어 제공되며 사용방법 또한 풍부하게 제공되기 때문에 몇 가지 간단한 단계로 미디어파이프에서 제공하는 AI기능을 활용한 응용 프로그램개발이 가능하다.

7) 성능 비교

Fig 17

위에서 소개한 mediapipe를 제외한 5개의 안면 인식 모델의 성능 비교표이다. 프로젝트가 비교적 낮은 성능인 라즈베리 파이 환경에서 진행되기 때문에 이를 고려하여 모델을 선정해야 했다. 최종적으로 메모리 소모량이 낮고, 실시간으로 얼굴을 탐지해야 하기에 반응 속도가 빠른 ‘Haar Cascade’와 ‘Dlib’ 라이브러리가 이번 프로젝트에 알맞은 것으로 보인다.

Fig 18

Dlib와 Mediapipe 라이브러리를 비교해 봤을 때, mediapipe 라이브러리의 장점은 다음과 같다. Dlib보다 좀 더 웹 애플리케이션과 스마트폰에서 사용하기에 편리하다는 점이다. 또한 얼굴 추적에는 기술적 특성이 약한 장치에 최적화된 BlazeFace 모델이 사용되어 사양이 상대적으로 부족한 라즈베리파이 환경에서 사용하기에 적합하다. BlazeFace는 여러 면에 동시에 468개의 주요 지점을 구축하고 3차원 공간에서 해당 좌표를 추정할 수 있기에 68개의 landmark를 사용하는 dlib 보다 성능이 더 좋다. 이런 이유들을 바탕으로 최종적으로 mediapipe 라이브러리를 이번 프로젝트에 사용하기로 결정했다.


  • 기술 로드맵

1. 휴대폰 거치대

Fig 19


2. 안면 인식 기술

Fig 20 (두장임)

1) OpenCV

‘OpenCV’는 1999년에 인텔에서 시작된 오픈 소스 컴퓨터 비전 라이브러리로, 기본적인 이미지 처리와 컴퓨터 비전 기능을 제공하는 첫 버전이 2000년대 초에 발표되었다. 2009년에는 C++ 기반의 인터페이스를 도입하면서 많은 새로운 기능과 알고리즘이 추가된 2.x 버전이 공개되었고, 이어서 2012년에는 GPU를 활용한 연산 최적화가 중점적으로 이루어진 2.4 버전이 출시되었다. 2015년에는 새로운 모듈 구조와 함께 딥러닝과 관련된 다양한 모듈이 도입된 3.x 버전이 등장하였고, 이는 인공 지능 연구와 응용 프로그램 개발에서의 활용성을 크게 높였다. 또한, 2018년에는 C++11 표준을 기반으로 API와 구조를 현대화한 4.x 버전이 발표되었으며, 이후 2020년대에는 딥러닝, AR, VR 등의 최신 컴퓨터 비전 기술에 초점을 맞춘 계속된 업데이트와 개선 작업이 진행되었다.

2) Haar Cascade

2001년에 Paul Viola와 Michael Jones에 의해 발표된 "Rapid Object Detection using a Boosted Cascade of Simple Features" 논문은 Haar-like 특징을 활용한 객체 검출 방법을 선보였으며, 이는 특히 실시간 얼굴 검출에 큰 효과를 보였다. 이 기법의 성공적인 도입으로, 2000년대 초반에 OpenCV 라이브러리에 Haar Cascade를 사용한 객체 검출 기능이 포함되어, 개발자들은 직접 분류기를 훈련시키거나 미리 훈련된 분류기를 사용하여 객체 검출을 수행할 수 있게 되었다. 이후, 2010년대에 접어들며, 딥러닝 기반의 객체 검출 기술인 R-CNN, Faster R-CNN, SSD, YOLO 등이 등장하면서 더 높은 정확도와 다양한 환경 대응 능력을 보였다. 앞으로의 미래 전망에서는 딥러닝과 같은 발전된 기술이 주요 연구와 상용화의 중심이 될 것으로 예상되며, Haar Cascade는 그 역할이 점차 줄어들 것으로 보인다. 최근의 딥러닝 발전에 따라 Haar Cascade의 중요성은 상대적으로 감소하였으나, 그 빠르고 경량한 특성으로 인해 제한된 리소스를 가진 환경이나 특정 어플리케이션에서는 여전히 유용하게 사용될 수 있다.

3) Dlib facial landmark detection

‘Dlib’은 2000년대 중반에 기본적인 기계 학습 및 컴퓨터 비전 라이브러리로 시작됐으며, 2010년대 초에 HOG 기반의 얼굴 탐지 기능을 도입했다. 2010년대 중반에는 68개의 얼굴 랜드마크 감지 기능이 추가됐고, 후반에는 딥러닝 및 ResNet 기반의 얼굴 인식 기술로 성능을 향상시켰다. 2020년대 초에는 GPU 지원 확장과 실시간 처리 성능 최적화를 중심으로 라이브러리가 지속적으로 발전 중이다.

4) Mediapipe

‘MediaPipe’는 구글에서 개발한 멀티 모달 및 크로스 플랫폼 머신 러닝 파이프라인을 구축하기 위한 프레임워크다. 이 프레임워크는 처음에는 인식 및 처리 파이프라인을 구축하는 데 초점을 맞췄으며, 다양한 기기의 능력을 활용하고, 자원 사용과 결과 품질 사이의 균형을 맞추며, 병렬 및 파이프라인 작업을 수행하고, 시계열 데이터를 적절히 동기화하는 데 도움이 되도록 설계됐다.

MediaPipe의 주요 기능과 능력에는 얼굴 감지, 손 추적, 제스처 감지, 객체 감지 등이 포함된다. 이 기능들은 주로 모바일 장치에 배포되었지만, WebAssembly 및 XNNPack ML 추론 라이브러리와 같은 기술을 통해 웹 애플리케이션으로 확장됐다. MediaPipe는 다양한 솔루션을 지원하며, C++, Python, JavaScript, Android, iOS 등 여러 프로그래밍 언어에서 사용할 수 있다. 이 프레임워크는 멀티 모달 그래프를 지원하며, 다양한 계산기가 별도의 스레드에서 실행되어 성능을 최적화한다. 또한, MediaPipe는 OpenCV 및 FFMPEG와 같은 다른 기술에 의존하여 비디오 및 오디오 데이터를 처리한다. GraphConfig는 MediaPipe 그래프의 토폴로지와 기능을 설명하는 사양으로, 그래프 내의 노드는 계산기의 인스턴스를 나타낸다. 이러한 노드는 타입, 입력, 출력 및 노드 별 옵션과 같은 구성을 지정한다. MediaPipe의 스케줄링 로직과 동기화 기본원리는 시계열 데이터를 맞춤식으로 처리할 수 있게 해준다. 초기 버전의 MediaPipe는 주로 C++을 기반으로 했으나, 시간이 지남에 따라 Python 등 다른 언어로의 접근성이 향상됐다. Python 버전은 초보자에게도 쉽게 접근할 수 있도록 설계됐다.

현재 MediaPipe는 지속적으로 개발되고 있으며, 새로운 기능이 추가되고 기존 기능이 향상되고 있다. 이 프레임워크는 시간에 따라 머신 러닝 애플리케이션 개발에 있어서 점점 더 중요한 도구로 자리잡고 있다.


  • 특허조사 및 특허 전략 분석
2013 2012 2010
휴대폰 거치대 침대용 단말기 거치대 휴대용 단말기의 침대용 거치대
사진 사진 사진
특징
* 고정판을 이용해 고정대상물에 부착하고, 억지회전을 통해 사용자가 원하는 방향으로 휴대용 단말기를 조절할 수 있음
* 침대 프레임이 없어도 벽면에 고정하여 사용 가능
* 침대 프레임에 별도로 고정 설치하는 파이프 또는 침대 프레임에 착탈 가능하게 결합되는 바이스를 통해 고정함
* 미사용시 접철시켜 부피를 축소시킴으로써 공간 활용에 유리한 효과가 있다
* 4자유도를 가지며, 상하좌우 각도를 조절해 사용자의 시선을 맞출 수 있음
* 휴대용 단말기를 침대에 거치할 수 있도록 하여 사용자가 침대에 누운 채로 휴대용 단말기를 조절할 수 있음
* 3자유도를 가지며, 엔드이펙터의 상하 각도 조절을 통해 사용자의 시선을 맞출 수 있음
* 침대 다리에 고정을 해야함
* 엔드이펙터는 홀더 형식이 아니라 받침대 부분에 넣는 형식임
청구항
특허 소멸 상태 * 침대 프레임에 착탈 가능하게 결합되는 바이스에 삽입되는 샤프트와 연결된는 샤프트 아암을 포함하는 침대용 단말기 거치대
* 단말기가 탄성적으로 걸리는 다수의 탄성후크를 포함한 헤드를 포함한 거치대
특허 포기 상태


특허 내용 특허 전략
특허 1 * 고정판을 이용해 고정 대상물에 부착학, 억지 회전을 통해 사용자가 원하는 방향으로 휴대용 단말기를 조절 가능 * 개발하고자 하는 face-tracking 스마트폰 거치대는 물리적인 조정없이 자동으로 사용자의 시선을 따라 움직임으로 편의성이 증대함
특허 2 * 침대 프레임에 별도로 고정 설치하는 파이프 또는 침대 프레임에 착탈 가능하게 결합되는 바이스를 통해 고정하기에 공간 활용에 유리함 * 관련 기술의 장단점을 파악하여 바이스 사용 여부를 결정함
* 사용자의 눈 감김 여부를 파악하여 장시간 감지가 되지 않으면 로봇 팔이 접히도록 하는 특허를 확보하고자 함
특허 3 * 홀더 방식이 아닌 받침대 부분에 넣는 형식을 사용하여 사용자가 힘을 많이 쓰지 않더라도 설치가 가능하도록 함 * 해당 특허와는 달리 사용자의 시선에 따라 상하 각도뿐 만 아니라 좌우 각도도 움직여야 하므로 홀더 방식을 채택하여 안정성을 더하고자 함

우리가 제작하고자 하는 제품과 유사한 특허를 찾아보면, face-tracking을 이용한 휴대폰 거치대를 찾지 못했다. 하지만 침대용 단말기 거치대는 침대 머리맡에 고정할 수 있다는 고정부에 대한 청구항이 있는데, 탈착이 가능한 바이스를 사용한다는 점과 모터를 사용하지 않는다는 점에서 우리의 제품과 차이가 있다고 판단했다. 또한 저러한 구조를 가지는 스마트폰 거치대가 너무 많이 상용화 되어 있기 때문에, 혹여나 구조가 비슷하더라도 유명무실한 특허인 것으로 판단했다.

시장상황에 대한 분석

  • 경쟁제품 조사 비교

휴대폰 거치대 시장을 조사해본 결과, face-tracking을 이용하여 자동으로 위치를 조절하는 다자유도 거치대를 찾지 못했다. 하지만 face-tracking을 이용한 다자유도 셀카봉은 시중에 판매되고 있다. 따라서 본 경쟁제품 조사에서는 기존에 판매되고 있는 휴대폰 거치대와, face-tracking을 이용한 짐벌을 조사했다.

제조사 모가비 잇츠온 바우아토 SHANGHAI YOUNG ZHENG TRADING COMPANY Shenzhen Funsnap Technology Co.Ltd Insta 360
제품명 MOG-102 v2 잇츠온 침대용 4단 관절 스마트폰 자바라 거치대 바우아토 4단 관절 맥세이프 무선 충전 자바라 침대 핸드폰 거치대 BYMO-Rolling 다퍼남 스마트폰 핸드 3축 짐벌 Capture2 인스타360 Flow 스마트폰 짐벌 white
사진 사진 사진 사진 사진 사진 사진
태블릿 커버 불가능 가능 불가능 불가능 불가능 불가능
자유도 다자유도 4 4 1 3 3
위치 조절 방식 수동 수동 수동 자동 (Face-Tracking) 자동 (Face-Tracking) 자동 (Face-Tracking)
관절 소재 스틸 알루미늄 스틸
가격(원) 26,000 20,000 30,000 69,000 98,000 199,000


  • 마케팅 전략 제시

1. 시장 조사 및 전략

Fig 21

Fig 22

2012년 대비 2023년도 스마트폰 사용률은 전 연령층에서 지속적으로 증가하였다. 특히 60대 이상의 고령층에서 크게 증가함을 볼 수 있다. 또한, 국내 고령층의 여가 활동 의식 변화 통계에서는 고령층의 여가 활동 중 동영상 시청이 가장 큰 부분을 차지하고 있음을 확인할 수 있다. 개발하고자 하는 face-tracking 스마트폰 거치대는 사용자들이 스마트폰을 이용해 편리하게 여러 컨텐츠를 시청할 수 있다는 편리함이라는 큰 장점을 가진다. 여기에 더해서 거동이 불편한 사용자들에게는 편리함을 넘어서 스마트폰 이용에 대한 접근성을 높여 준다는 점에서 큰 경쟁력이 될 것이다. 고령층에는 거동이 불편한 사용자가 다른 연령층 대비 많아 주 소비자 층이 될 것이라 예상된다.

2. SWOT 분석

Strength Weakness
* Face-tracking을 통해 자동으로 자세 변경마다 별도의 수동 조정 없이 스마트폰을 편리하게 볼 수 있음 * 자동 트래킹 기능 동작 시 발생하는 소음으로 인해 불편함을 느낄 수 있음
* 4 자유도로는 사용자의 모든 자세에 맞는 위치로 동작 시키는데 한계가 있음
* 자동으로 동작하는 거치대인 만큼 스마트폰 고정력과 내구성이 부족할 수 있음
Opportunity Threat
* 사용자의 얼굴 방향만으로 스마트폰의 위치를 정할 수 있기 때문에 거동이 불편한 사용자들의 니즈를 충족시킬 수 있음 * 다른 경쟁 제품에 비해 가격 경쟁력이 부족
* 경쟁 제품의 내구성과 고정력 부분에서는 이미 높은 수준으로 연구 개발되어 있음


S-O W-O
* Face-tracking을 통해 자동으로 자세 변경마다 별도의 수동 조정 없이 스마트폰을 편리하게 볼 수 있음 * 자동 트래킹 기능 동작 시 발생하는 소음으로 인해 불편함을 느낄 수 있음
* 4 자유도로는 사용자의 모든 자세에 맞는 위치로 동작 시키는데 한계가 있음
* 자동으로 동작하는 거치대인 만큼 스마트폰 고정력과 내구성이 부족할 수 있음
S-T W-T
* 사용자의 얼굴 방향만으로 스마트폰의 위치를 정할 수 있기 때문에 거동이 불편한 사용자들의 니즈를 충족시킬 수 있음 * 다른 경쟁 제품에 비해 가격 경쟁력이 부족
* 경쟁 제품의 내구성과 고정력 부분에서는 이미 높은 수준으로 연구 개발되어 있음

개발과제의 기대효과

기술적 기대효과

  • 사용자 편의성 향상

face-tracking을 통해 사용자의 얼굴 방향을 실시간으로 감지하고 스마트폰의 위치를 자동으로 조절하여, 사용자들은 따로 조절하지 않고도 최적의 시야에서 콘텐츠를 즐길 수 있어 편리함을 경험할 수 있다.

  • 접근성 향상

얼굴 방향 이동에 따라 스마트폰을 조절함으로써, 장애인 및 특수한 상황에 있는 사용자들에게도 보다 쉬운 사용이 가능하게 한다.

경제적, 사회적 기대 및 파급효과

본 연구에서 다룬 사용자의 얼굴을 추적하여 휴대폰 홀더의 위치를 알맞게 조정하는 기술은, 해당 제품은 단순 침대용 휴대폰 거치대 차원에서 벗어나, 다른 작업을 하면서 화면을 봐야하는, 양손을 자유롭게 활용할 수 없는 다양한 상황에서 사용자의 불편함을 해소시켜 줄 것이다. 뿐만 아니라, 기존 거치대의 자세를 수정하는 것조차 어려운 거동이 불편한 노약자나 환자의 경우에도 큰 도움을 가져다줄 수 있을 것이다. 특히, 병원 내 개인 맞춤형 모니터를 사용하는 입원 환자의 경우, 본 연구에서 개발한 기술을 적용하면 모니터 사용에 있어서 생기는 거동 불편자의 많은 불편함을 해결해 줄 것으로 기대된다. 본 연구에서는 4 DOF의 낮은 자유도의 거치대만 다루었지만, 추후 연구를 통해 더욱 다양한 상황에서 사용자에게 편리함을 가져다줄 수 있을 것이다.

이 외에도, 로봇공학의 새로운 적용 분야를 개척하여, 새로운 활로를 찾는다는 면을, 그리고 거치대 시장의 흐름 변화를 유도할 수 있다는 점을 고려하면 경제적 파급력도 있을 것으로 추측된다.

하지만 우려되는 부분 또한 있다. 자동 거치대에 너무 의존하게 되는 나머지 사람이 게을러질 수 있다는 것이다. 하지만 이러한 영향보다 다양한 불편한 상황을 해결할 수도 있다는 점, 그리고 거동이 불편한 사람에게 큰 도움이 될 수 있다는 장점이 더 크다고 판단이 되기 때문에, 본 연구는 이 단점에도 불구하고 연구 가치를 갖는다고 할 수 있다.

기술개발 일정 및 추진체계

개발 일정

내용

구성원 및 추진체계

내용

설계

설계사양

제품의 요구사항

내용

설계 사양

내용

개념설계안

내용

이론적 계산 및 시뮬레이션

내용

상세설계 내용

내용

결과 및 평가

완료 작품의 소개

프로토타입 사진 혹은 작동 장면

내용

포스터

내용

관련사업비 내역서

내용

완료작품의 평가

내용

향후계획

내용

특허 출원 내용

내용