본문 바로가기

AI허브

[데이터 리뷰] AIHUB(자율주행) - 로봇 관점 주행 영상 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #48 AIHUB(자율주행) - 로봇 관점 주행 영상 데이터 자율주행은 자동차뿐만 아니라 드론이나 로봇 등에도 적용시킬 수 있는데요, 특히 로봇의 경우 자동차나 드론이 주행하기 어려운 실내에서 활용할 수 있다는 장점을 갖고 있습니다. 따라서 로봇의 자율주행에 대해서도 많은 기술개발이 이루어지고 있는데요, 특정 식당에서 로봇이 음식을 서빙을 하는 등 실생활에 많이 접목된 사례들을 발견할 수 있습니다. 이와 관련하여 AIHUB 플랫폼에서는 '로봇 관점 주행 영상' 데이터를 제공하고 있는데요, 국내 자율주행 로봇에 대한 산업적 수요 증대와 국내 환경에 적합한 자율주행 로봇 서비스 산업 활성화를 위해 로봇의 이동 중 직면 가능한 장애물 정보에 대한 데이터를 구축한 데이.. 더보기
[데이터 리뷰] AIHUB(농축수산) - 농산물 품질(QC) 이미지 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #37 AIHUB(농축수산) - 농산물 품질(QC) 이미지 데이터 농산물은 어떠한 환경과 어떠한 조건에서 키웠는지에 따라 그 품질이 달라질 수 있는데요, 품질에 따라 가격이 결정되기도 합니다. 따라서 좋은 품질의 농산물을 생산하기 위한 많은 노력이 이루어지고 있습니다. 한편, 다양한 품질의 농산물을 분류하고 선별하기 위해서 많은 인력이 소모되고 있는데요, 만약 농산물의 품질을 자동으로 분류할 수 있는 인공지능 기술이 개발된다면 좀 더 객관적인 기준과 판단으로 분류가 이루어질 수 있습니다. 이와 관련해서 AIHUB에서는 농산물의 상품 등급 분류를 위해 20종의 농산물의 상품 등급별 이미지 데이터를 구축한 '농산물 품질(QC) 이미지' 데이터를 제공하고 있습니다. .. 더보기
[데이터 리뷰] AIHUB(농축수산) - 동의보감 약초 이미지 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #34 AIHUB(농축수산) - 동의보감 약초 이미지 데이터 산에서는 다양한 약초가 자라고, 그 효능과 기능에 따라 상품성이 알려지면서 약초를 캐는 사람들이 많아졌는데요, 종종 부정확한 정보로 약초가 아닌 독초를 오용해 중독사고가 발생한 사례들을 찾아볼 수 있습니다. 이러한 경우, 민간에서 채취 및 복용하는 약초는 전적으로 개인의 책임으로 돌아가게 됩니다. 따라서 정확하게 분별하여 약초를 캐는 것이 중요한데요, 아무래도 비슷하게 생긴 풀들 사이에서 원하는 약초를 찾는 일은 전문가가 아니라면 어려울 수 있습니다. 따라서, 이와 관련해서 AIHUB에서는 생활 속 자연 약초의 안전 이용 기준 및 정확한 판별에 대한 도움을 제공하고자 '동의보감 약초 이미지' 데이터를 .. 더보기
[데이터 리뷰] AIHUB(국토환경) - 관광 지식베이스 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #29 AIHUB(음성/자연어) - 관광 지식베이스 데이터 4차 산업혁명 시대 속에서 각 국가 및 기업들은 인공지능 기술개발을 위한 기계학습 데이터 구축 등 관련 인프라 구축을 활발하게 진행 중인데요, 특히 많은 이미지 학습데이터를 기반으로 한 이미지 인식 기술을 지속적으로 연구 및 개발하고 있다고 합니다. 이러한 흐름에 발맞춰, 국내에서도 기계학습에 필요한 다양한 패턴의 고품질 이미지 데이터 확보를 위해 다양한 영역에서의 이미지 데이터를 구축하고 있다고 합니다. 이와 관련해서 AIHUB에서는 '관광산업'과 관련하여 국내 관광 및 인공지능 산업의 글로벌 경재력 강화를 위해 '관광 지식베이스' 데이터를 제공하고 있습니다. 이 데이터는 식당 주변 전경(간판, 입간판.. 더보기
[데이터 리뷰] AIHUB(음성/자연어) - 공공행정문서 OCR 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #28 AIHUB(음성/자연어) - 공공행정문서 OCR 데이터 대부분의 공공기관이나 공기업 등에서는 1년에 몇 만 건의 공공행정문서를 처리하는데요, 눈으로 일일이 보고 처리하는 데에 많은 시간과 불필요한 인력이 낭비되고 있습니다. 따라서, 이러한 공공행정문서들을 자동으로 인식하여 처리할 수 있는 기술 및 시스템은 필요시 되고 있답니다. 하지만 공공행정문서마다 그 형태나 포맷이 제각각이고, 인쇄체뿐만 아니라 손으로 작성된 문서도 있으며, 스캔된 문서 이미지를 이용한다는 점에서 해상도도 제각각일 수 있어서 특화된 기술, 높은 정확도의 기술이 요구됩니다. 이에 대해 이를 만족시킬 수 있는 기술 중 하나는 바로 OCR이라는 것인데요, OCR(Optical Charact.. 더보기
[데이터 리뷰] AIHUB(음성/자연어) - 한국어 SNS 대화 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #27 AIHUB(음성/자연어) - 한국어 SNS 대화 데이터 코로나19의 영향으로 언택트 시대가 되면서 점점 온라인상의 대화가 증가하고, 비대면 회의, 상담, 업무 등이 증가하게 되었습니다. 이렇게 의사소통이 대화 음성이나 텍스트로 이루어짐에 따라 관련 대화 데이터도 급속도로 증가하게 되었는데요, 이러한 데이터의 활용성을 높이기 위해 적절한 대화 처리 기술의 도입이 요구되고 있다고 합니다. 이와 관련해서 AIHUB에서는 한국어 구어체 텍스트 기반의 자연어처리 AI 기술 개발을 목적으로 한국인의 일상 대화 메신저 채팅 데이터를 구축한 '한국어 SNS 대화' 데이터를 제공하고 있습니다. 따라서 이번 데이터 리뷰기에서는 이 데이터가 어떻게 이루어져 있는지 살펴보고,.. 더보기
[데이터 리뷰] AIHUB(음성/자연어) - 논문자료 요약 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #26 AIHUB(음성/자연어) - 논문자료 요약 데이터 한 번쯤 논문을 찾아서 읽어본 경험이 있다면 공감하시겠지만, 논문에 이미지보다 글씨가 빽빽하게 있고, 수준 높은 어려운 내용들이 들어가 있다 보니 조금은 어렵고 딱딱하게 느껴질 수 있습니다. 거기에다 또, 만약 읽어야 할 논문이 많다면 논문 읽는 것에 대해 부담이 될 수도 있습니다. 하지만 만약 논문의 핵심내용을 뽑아 요약을 해주는 인공지능이 있다면 어떠할까요? 분명 많은 시간이 절약될 수 있고, 핵심적인 요약 내용을 먼저 읽고 논문을 읽으면 한층 이해하기 쉬워질 수 있습니다. 이와 관련해서 AIHUB에서는 다양한 주제의 한국어로 이루어진 학술논문이나 특허명세서에서 요약문을 도출해낼 수 있는 인공지능을 훈.. 더보기
[데이터 리뷰] AIHUB(음성/자연어) - 한국어 대화 요약 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #25 AIHUB(음성/자연어) - 한국어 대화 요약 데이터 코로나19의 장기화로 언택트 시대가 됨으로써, 인터넷 또는 sns 메신저를 통해 비대면 의사소통의 수요가 매우 증가했는데요, 이로 인해 온라인 상에 축적되는 의사소통 관련 텍스트 데이터가 엄청난 솓도와 규모로 축적되고 있다고 합니다. 하지만 이렇게 많은 텍스트 데이터를 본문 그대로 사용하여 활용하자면 그 양이 많기 때문에 대화 데이터의 활용성을 높이기 위해서는 대화 요약 기술의 도입이 요구된다고 합니다. 이와 관련해서 AIHUB에서는 뉴스, 기사 등의 문어체에 비해 생략이나 변형이 많고, 대화의 문맥을 고려해야 할 특수성이 있는 대화 요약 기술 개발을 위한 학습 데이터 구축을 목적으로 한 '한국어 대화.. 더보기
[데이터 리뷰] AIHUB(비전) - 한국어 글자체 이미지 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #23 AIHUB(비전) - 한국어 글자체 이미지 데이터 차량 번호판 인식 또는 문서를 사진 찍으면 글씨가 자동으로 인식되는 서비스 등을 한 번쯤은 사용해보셨을 수 있는데요, 이러한 기술 모두 인공지능이 글자 이미지를 학습하여 해당 글자를 인식하게 되는 기술입니다. 이러한 기술은 특히 종이문서를 디지털화하여 업무처리를 자동화하거나 시각장애우를 위한 서비스 개발을 위해 많이 연구되고 있다고 합니다. 이와 관련해서 인공지능 빅데이터 플랫폼인 에서는 현대 한글 11172자를 가장 많이 활용하는 폰트 50종을 선정하여 해당 글자체의 이미지와 인공지능 글자 인식을 위한 학습용 데이터 셋인 '한국어 글자체 이미지' 데이터를 제공하고 있습니다. 그렇다면 이번 데이터 리뷰기에.. 더보기
[데이터 리뷰] AIHUB(비전) - 한국인 감정인식을 위한 복합 영상 데이터 데이터 리뷰 : 데이터 대신 읽어드립니다! #22 AIHUB(비전) - 한국인 감정인식을 위한 복합 영상 데이터 사람의 얼굴이나 얼굴 표정을 통해 그 사람의 성별, 연령, 감정 등을 예측할 수 있는데요, 만약 인공지능이 자동으로 그 사람의 정보나 감정 등을 예측하여 판단할 수 있다면 어떨까요? 누군가의 감정을 빠르게 포착하는 것은 하나의 서비스로도 이어질 수 있는데요, 예를 들어 그 사람의 만족도를 측정할 수 있거나 감정이나 기분 등을 파악해 멘탈적인 헬스 케어 서비스로 이어질 수 있습니다. 이와 관련해서 인공지능 빅데이터 플랫폼인 에서는 한국인의 얼굴 표정과 장소 맥락을 고려하여 인공지능이 사람의 감정을 이해할 수 있는 학습 모델 개발을 장려하기 위해 '한국인 감정인식을 위한 복합 영상' 데이터를 제공.. 더보기