기업조회

본문 바로가기 주메뉴 바로가기

동향 기본정보

Microsoft社, 분산데이터시스템에 기기학습기술 접목

동향 개요

기관명, 작성자, 작성일자, 내용, 출처, 원문URL, 첨부파일 순으로 구성된 표입니다.
기관명 NDSL
작성자 KISTI 미리안 글로벌동향브리핑
작성일자 2017-06-10 00:00:00.000
내용 최근 Microsoft社는 분산데이터 분석시스템인 아파치 스파크 (Apache Spark)를 위한 기기학습 라이브러리를 발표한 것으로 나타났는데, 해당 기술을 통해 빅데이터 처리 툴을 활용함에 있어 보다 많은 생산성을 데이터 과학자들에게 제공해줄 것으로 예상되어 관련 내용을 조사해보기로 한다. 소프트웨어를 비롯해 클라우드 서비스들 관련 기업들은 데이터 과학자들의 데이터 처리속도를 높이고 새로운 기기학습 기술을 활용해 보다 나은 데이터 분석기술을 제공하는데 초점을 두고 있다 할 수 있겠다. 여기에는 딥러닝이나 기기학습 기술이 활용되고 있다고 볼 수 있겠는데, Microsoft社는 분산데이터 분석시스템인 스파크가 확장성이 뛰어난 기기학습 모델로 평가받고 있지만 인덱스의 색인화 방식이나 다양한 기능성들을 수집하고 기기학습 알고리즘에서 기대할 수 있는 형태로 데이터를 변환하는 방식에 있어 어려움을 겪어왔다고 한다. 이에 이번 기기학습 라이브러리 기술을 접목시켜 다수의 많은 업무들을 단순화시킬 뿐 아니라 데이터 과학자들에게 보다 높은 생산성을 부여하고 기기학습 측면에서 데이터 과학분야에 초점을 둘 수 있는 기반을 마련했다 볼 수 있다 하겠다. 특히 새롭게 개발된 어플리케이션 인터페이스를 활용할 경우, 최첨단 DNN 알고리즘을 활용하는 이미지 분석을 비롯해 컴퓨터 시각화 라인을 보다 빠르게 구축할 수 있는 것으로 나타났다. 특히 주목할만한 기능 중 하나는 이미 훈련된 신경망 네트워크를 활용해 이미지로부터 특정 기능을 추출하여 해당 기능을 기기학습 모델로 전달하게 된다고 한다. 뿐만 아니라 이미 훈련된 모델이 특정 도메인에 치중되어 부적합한 것으로 판단될 경우, DNN 모델을 훈련시킬 수 있는 기능도 제공하고 있다고 한다. 마지막으로 데이터 과학자들이 공개소스 컴퓨터 비전이라 불리우는 OpenCV 기반의 이미지 변환을 사용해 데이터를 읽고 준비할 수 있는 기능을 제공하는 만큼 데이터 과학자들이 보다 쉽고 편리하게 생산성을 증대시킬 수 있는 기반이 마련될 수 있을지 그 귀추가 주목되는 시점이라 하겠다.
출처
원문URL http://click.ndsl.kr/servlet/OpenAPIDetailView?keyValue=03553784&target=TREND&cn=GTB2017002346
첨부파일

추가정보

과학기술표준분류, ICT 기술분류, 주제어 순으로 구성된 표입니다.
과학기술표준분류
ICT 기술분류
주제어 (키워드) 1. 데이터 과학자; 기기학습; 아파치 스파크; 2. data scientist; machine learning; Apache Spark;