개발자 끄적끄적
합성곱 신경망 응용(2023.1.31) 본문
<AI - 영상 이해 서비스>
- API(응용 프로그램 인터페이스 : Application Program Interface) : 소프트 웨어 응용 프로그램 구축을 위한 일련의 루틴
프로토콜 및 도구 집합들을 지칭한다
기본적으로 API는 소프트웨어 구성 요소의 상호 작용 방식을 지정한다
1. Google Vision API : Cloud Vision API Demo
2. MicroSoft Vision API : MS Azure Vision API Demo
3. Amazon Rekognition API : AWS Rekognition API Demo ⇐ (requires to log-in)
<Google Vision AI>
- 요청(request)와 응답(response)
- 형식 : JSON(JavaScript Object Notation)
- 지원 인식 기능
- '객체' 감지
- 인쇄 및 필기 입력 '텍스트' 감지
- '얼굴' 감지
- '명소(Place)' 및 '제품 보고' 식별
- '일반 이미지 속성' 할당
- '웹 항목' 및 페이지 감지
- '콘텐츠' 검토
<MicroSoft Vision AI>
- 시각적 데이터를 사용하여 콘텐츠(개체에서 개념까지)에 레이블을 지정하고, 인쇄된 텍스트와 필기 텍스트를 추출하고,
브랜드와 랜드마크 같은 친숙한 주제를 인식하고, 콘텐츠를 조정하는게 가능하다
- 지원 인식 기능
- 콘텐츠 태크
- 개체 감지
- 이미지 분류
- 이미지 설명
- 얼굴 감지
- 이미지 형식 감지
- 도메인 특성 콘텐츠
- 색 구성표 감지
- 스마트 썸네일
- 인쇄 및 필기 텍스트 인식
- 성인 콘텐츠 검색
<Amazon Rekognition>
- 이미지에 있는 피사체, 개념, 장면에 자동으로 레이블을 지정하고 신뢰도 점수를 제공한다
- 요청(request)와 응답(response)
- Format : JSON
- 지원 인식 기능
- 객체 및 장면 감지
- 이미지 조절
- 얼굴 분석
- 유명 인사 인식
- 얼굴 비교
- 이미지 내 텍스트
<JSON>
- JSON(JavaScript Object(=data type) Notation)은 간단한 '데이터 교환 형식'이다
- 읽고 쓰기가 쉽다
- 기계가 구문 분석하고 생성하기 쉽다
- JSON은 완전히 언어에 독립적인 텍스트 형식이다
- C++, C#, Java, JavaScript, Perl, Python 및 기타 프로그램 언어들에서 이상적인 '데이터 교환 언어'로 사용된다
<JSON Syntax>
- 데이터는 이름:값 쌍으로 넣는다
ex) {"name":"Jun"}
- 데이터는 쉼표로 구분된다
ex) {"name":"Jun", "age":55}
- 객체(object)는 중괄호{}에 넣는다
ex) {"employee":{"name":"John", "age":30, "city":"New York"}}
- 배열(array)은 대괄호[]에 넣는다
ex) {"employees":["John", "Anna", "Peter"]}
- 값으로는 문자열, 숫자, JSON 객체, 배열, 불리안(boolean), null이 올 수 있다
ex) {"item" : "shirt", "sale":true, "brand":null}
'생활 속 인공지능' 카테고리의 다른 글
합성곱 신경망(2023.10.23) (0) | 2023.10.25 |
---|