개발자 끄적끄적

합성곱 신경망 응용(2023.1.31) 본문

생활 속 인공지능

합성곱 신경망 응용(2023.1.31)

햏치 2023. 10. 31. 14:19

<AI - 영상 이해 서비스>
- API(응용 프로그램 인터페이스 : Application Program Interface) : 소프트 웨어 응용 프로그램 구축을 위한 일련의 루틴
  프로토콜 및 도구 집합들을 지칭한다
  기본적으로 API는 소프트웨어 구성 요소의 상호 작용 방식을 지정한다
 
1. Google Vision API : Cloud Vision API Demo 
2. MicroSoft Vision API : MS Azure Vision API Demo
3. Amazon Rekognition API : AWS Rekognition API Demo  ⇐ (requires to log-in)




<Google Vision AI>
  - 요청(request)와 응답(response)
  - 형식 : JSON(JavaScript Object Notation)

- 지원 인식 기능
  - '객체' 감지
  - 인쇄 및 필기 입력 '텍스트' 감지
  - '얼굴' 감지
  - '명소(Place)' 및 '제품 보고' 식별
  - '일반 이미지 속성' 할당
  - '웹 항목' 및 페이지 감지
  - '콘텐츠' 검토




<MicroSoft Vision AI>
- 시각적 데이터를 사용하여 콘텐츠(개체에서 개념까지)에 레이블을 지정하고, 인쇄된 텍스트와 필기 텍스트를 추출하고,
  브랜드와 랜드마크 같은 친숙한 주제를 인식하고, 콘텐츠를 조정하는게 가능하다

- 지원 인식 기능
  - 콘텐츠 태크
  - 개체 감지
  - 이미지 분류
  - 이미지 설명
  - 얼굴 감지
  - 이미지 형식 감지
  - 도메인 특성 콘텐츠
  - 색 구성표 감지
  - 스마트 썸네일
  - 인쇄 및 필기 텍스트 인식
  - 성인 콘텐츠 검색




<Amazon Rekognition>
- 이미지에 있는 피사체, 개념, 장면에 자동으로 레이블을 지정하고 신뢰도 점수를 제공한다
- 요청(request)와 응답(response)
- Format : JSON

- 지원 인식 기능
  - 객체 및 장면 감지
  - 이미지 조절
  - 얼굴 분석
  - 유명 인사 인식
  - 얼굴 비교
  - 이미지 내 텍스트



<JSON>
- JSON(JavaScript Object(=data type) Notation)은 간단한 '데이터 교환 형식'이다
  - 읽고 쓰기가 쉽다
  - 기계가 구문 분석하고 생성하기 쉽다
  - JSON은 완전히 언어에 독립적인 텍스트 형식이다
  - C++, C#, Java, JavaScript, Perl, Python 및 기타 프로그램 언어들에서 이상적인 '데이터 교환 언어'로 사용된다




<JSON Syntax>
- 데이터는 이름:값 쌍으로 넣는다  
  ex) {"name":"Jun"}

- 데이터는 쉼표로 구분된다  
  ex) {"name":"Jun", "age":55}

- 객체(object)는 중괄호{}에 넣는다  
  ex) {"employee":{"name":"John", "age":30, "city":"New  York"}}

- 배열(array)은 대괄호[]에 넣는다 
  ex) {"employees":["John", "Anna", "Peter"]}

- 값으로는 문자열, 숫자, JSON 객체, 배열, 불리안(boolean), null이 올 수 있다  
  ex) {"item" : "shirt", "sale":true, "brand":null}

'생활 속 인공지능' 카테고리의 다른 글

합성곱 신경망(2023.10.23)  (0) 2023.10.25