Code Monkey home page Code Monkey logo

project-miai's Introduction

Project MIAI

본 페이지는 MIAI 연구팀에서 진행 중인 멀티모달 인터랙션 인공지능 기술 연구 과제의 github 페이지입니다. 해당 페이지에서는 연구 과제의 진행 상황과 결과물을 확인하실 수 있습니다.

(1세부) 인간과 교감하는 멀티모달 인터랙션 인공지능 기술

목표

  • 복합 모달의 다양한 표현 요소들을 언어적인 관점에서 연계 분석하여 융합된 대화로 모델링하는 원천기술 및 실세계 기반 실증 연구를 수행
    • 표정/동작/음성 등의 통합 인식으로 사용자와의 실시간 실감 인터랙션 지원
    • 복합 대화의 표출 기반 다양한 감정 정보를 반영할 수 있는 음성 합성
    • 복합 모달 및 언어레벨에 따른 정보를 활용한 고차원 사용자 이해 기술
    • 음성 인식 오류에 강인한 멀티모달 종단형 준언어 모델 학습 기술
    • 메타버스 및 AR 글래스 기반 교감형 상담/비서 서비스
    • 음성/제수처/표정/다중뷰 등 복합 모달리티 기반 데이터 구축
    • 복합대화 핵심요인 범주화 기술을 통한 대화 인터랙션 향상
    • 멀티 모달과 상식 기반으로 이해하는 표현 모델 개발

기간

  • 1단계: 2022. 04. 01 ~ 2024. 12. 31 (2년 9개월)
    • 2023년 현재: 1단계 2차년도 연구 수행 중
  • 2단계: 2025. 01. 01 ~ 2026. 12. 31 (2년)

연구 기관

  • 주관연구기관: 한국전자기술연구원
  • 공동연구기관: 한국전자기통신연구원, (주)솔트룩스, (주)마인즈랩, 서울대학교 산학협력단, 울산과학기술원
  • 국제공동연구: University of Birmingham (UK)

통합 Build 방안

⚠️ 주의사항: (TBD)

(TBD)

공개 SW

⚠️ 주의사항: 이해, 추론, 표출 순으로 테이블을 작성해주시고, 각 파트별 동기화해주세요.

Category Title Repository Affiliation
Understanding Facial expression recognition Link KETI
Inference Multi-modal Information Integration Understanding Model v1.0 Link KETI
Inference Information Recognition_verbal Link KETI
Inference Empathetic Dialog_verbal Link KETI
Representation Text-to-Synthesis Baseline Link KETI
Understanding Backchannel Prediction Link ETRI

연구 논문

⚠️ 작성 주의사항: 최신 공개 내용을 상단으로 정렬해주세요.

Authors Title Publication Affiliation Link
(TBD) (TBD) (TBD) (TBD) (TBD)

Acknowledge

This work was supported by Institute of Information & communications Technology Planning & Evaluation (IITP) grant funded by the Korea government(MSIT) (No.2022-0-00608, Artificial intelligence research about multi-modal interactions for empathetic conversations with humans)

project-miai's People

Contributors

beckgom avatar seolgi avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.