Sitemap

A list of all the posts and pages found on the site. For you robots out there is an XML version available for digesting as well.

Pages

Posts

Future Blog Post

This post will show up by default. To disable scheduling of future posts, edit config.yml and set future: false.

Blog Post number 4

This is a sample blog post. Lorem ipsum I can’t remember the rest of lorem ipsum and don’t have an internet connection right now. Testing testing testing this blog post. Blog posts are cool.

Blog Post number 3

This is a sample blog post. Lorem ipsum I can’t remember the rest of lorem ipsum and don’t have an internet connection right now. Testing testing testing this blog post. Blog posts are cool.

Blog Post number 2

This is a sample blog post. Lorem ipsum I can’t remember the rest of lorem ipsum and don’t have an internet connection right now. Testing testing testing this blog post. Blog posts are cool.

Blog Post number 1

This is a sample blog post. Lorem ipsum I can’t remember the rest of lorem ipsum and don’t have an internet connection right now. Testing testing testing this blog post. Blog posts are cool.

portfolio

publications

Deep Metric Learning을 활용한 합성곱 신경망 기반의 피부질환 분류 기술

Abstract

본 논문에서는 사람들에게 흔히 발생할 수 있고, 개인이 명확히 판별하기 힘든 티눈과 사마귀를 합성곱 신경망을 통해 분류하는 방법을 제안한다. 사용한 데이터 세트는 3개의 클래스로 이루어져 있으며, 총 2,515장의 이미지를 가지고 있다. 데이터 세트는 학습 데이터의 수가 적고 클래스 불균형 문제가 존재하기에 분류 학습 시에 특정 클래스에 과적합이 발생할 수 있다. 본 논문에서는 데이터 간의 유사도를 측정하는 Deep Metric Learning 방식을 적용하여 분류를 수행하며, 교차 엔트로피 손실 함수와 성능을 비교한다. 실험 결과 Deep Metric 손실 함수를 활용했을 시 97.41%의 정확도를 기록하였으며, 교차 엔트로피 손실 보다 4.57% 높은 성능을 보일 수 있음을 확인했다.

김강민, 김판구, 전찬준. 2021. "Deep Metric Learning을 활용한 합성곱 신경망 기반의 피부질환 분류 기술." 스마트미디어 저널, vol. 10, no. 4, 2021.12.28.

Synthetic Data Generator for Solving Korean Arithmetic Word Problem

Abstract

A math word problems (MWPs) comprises mathematical logic, numbers, and natural language. To solve these problems, a solver model requires an understanding of language and the ability to reason. Since the 1960s, research on the design of a model that provides automatic solutions for mathematical problems has been continuously conducted, and numerous methods and datasets have been published. However, the published datasets in Korean are insufficient. In this study, we propose a Korean data generator for the first time to address this issue. The proposed data generator comprised problem types and data variations. Moreover, it has 4 problem types and 42 subtypes. The data variation has four categories, which adds robustness to the model. In total, 210,311 pieces of data were used for the experiment, of which 210,000 data points were generated. The training dataset had 150,000 data points. Each validation and test dataset had 30,000 data points. Furthermore, 311 problems were sourced from commercially available books on mathematical problems. We used these problems to evaluate the validity of our data generator on actual math word problems. The experiments confirm that models developed using the proposed data generator can be applied to real data. The proposed generator can be used to solve Korean MWPs in the field of education and the service industry, as well as serve as a basis for future research in this field.

Kangmin Kim, Chanjun Chun. 2022. "Synthetic Data Generator for Solving Korean Arithmetic Word Problem." Mathematics, vol. 10, no. 19, article no. 3525, Sep. 2022. (IF: 2.4)

한국어 문장형 수학 문제를 활용한 심층 산술 풀이모델

Abstract

본 논문에서는 한국어 문장형 수학 문제 풀이를 위한 데이터 세트를 생성하고 기계 번역 모델을 학습시켜 문제 풀이모델의 성능과 데이터의 유효성을 확인한다. 문장형 수학 문제란 수학적 논리 관계가 함축된 자연어 문장을 의미한다. 이러한 문제를 풀기 위해 모델은 언어의 이해와 추론 능력이 요구된다. 해외에는 해당 연구를 위한 데이터 세트가 마련되어 있지만, 국내에는 해당 한국어 데이터 세트에 대한 공개가 부족하다. 이러한 이유로 본 논문에서는 한국어 데이터 생성기를 구현한다. 데이터 생성기는 네 가지 유형, 42가지 세부 문제 유형 으로 구성된다. 학습에는 15만 개의 생성 데이터를 사용하며, 모델의 평가에는 학습 문제 유형과 상관없이 실제 수학 문제집에서 등장하는 문제 311개를 사용한다. 이를 통해 모델 성능 측정과 모델이 생성 데이터의 형식에만 과적합 되진 않았는지 확인한다. 실험 결과 본 데이터 생성기가 기계 번역 기반의 수학 문제 풀이모델에 적용 가능함을 확인하였다.

김강민, 전찬준. 2022. "한국어 문장형 수학 문제를 활용한 심층 산술 풀이모델." 제3회 한국 인공지능 학술대회, 2022.09.28 - 30.

진단 시뮬레이션을 위한 Conformer 기반의 질의응답 텍스트 모델 설계

Abstract

임상실습 교육은 학생들에게 이론적 지식을 기초로 전문 역량 및 현장 대처능력을 개발시켜 전문적인 의료인으로서의 성장을 도모한다. 표준화 환자 기법은 임상실습 교육 중 하나로, 환자 역할을 하는 연기자를 활용하는 교육 방식이다. 이 기법은 의료인들에게는 실제 환자와의 면담 상황을 익숙해지도록 돕고 교육자들에게는 학생들의 임상수행 능력 평가를 돕는 도구이다. 그러나 표준화 환자를 이용한 실습은 연기자 활용 과정에서 소모되는 인건비와 그들을 교육할 전문 인력 부족의 문제와 마주하게 된다. 본 논문에서는 임상진단 시나리오의 질의응답 텍스트와 Conformer를 활용한 기계번역 기반의 QA 모델을 통해 연기자를 대체할 수 있는 AI-환자를 제안한다.

김강민, 신영서, 최우열, 전찬준. 2023. "진단 시뮬레이션을 위한 Conformer 기반의 질의응답 텍스트 모델 설계." 제15회 융합 스마트미디어 시스템 워크샵, 2023.02.05 - 07.

한국어 문장형 수학 문제 풀이를 위한 Conformer 기반의 심층 산술 풀이모델

Abstract

문장형 수학 문제(Math Word Problem, MWP)는 수식과 같은 수학적 언어가 아닌 자연어로 서술된 수학 문제를 의미한다. ‘5 + 3’ 과 같이 주어진 수식을 풀어내는 단순 계산문제와 달리 문장형 수학 문제에서는 주어진 상황을 이해하고, 이를 토대로 대응하는 풀이식을 세워야 한다. 이로 인해 문장형 수학 문제 풀이모델은 문제 해결력에 더불어 독해력과 추론력이 요구된다. Conformer는 음성 데이터의 지역적 정보와 전역적 정보를 유기적으로 활용하기 위해 합성곱 신경망과 Transformer를 결합한 모델이다. 해당 모델은 음성 인식과 화자 분리와 같은 음성 분야에서 Transformer보다 뛰어난 성능을 보이며 활발히 연구되고 있다. Conformer의 데이터 특징 정보 활용 방식은 자연어 처리에서도 문장 내 단어 간의 대응 관계 및 특징 학습에 효과를 보일 수 있을 것으로 예상된다. 이에 본 논문에서는 Conformer를 문장형 수학 문제 풀이에 적용하여, 모델 구조로 인한 독해력과 추론력 향상을 Transformer와 비교 분석한다.

김강민, 박현우, 박시웅, 전찬준. 2023. "한국어 문장형 수학 문제 풀이를 위한 Conformer 기반의 심층 산술 풀이모델." 한국전자파학회 동계종합학술대회, 2023.02.15 - 18.

Conformer‑Based Dental AI Patient Clinical Diagnosis Simulation Using Korean Synthetic Data Generator for Multiple Standardized Patient Scenarios

Abstract

The goal of clinical practice education is to develop the ability to apply theoretical knowledge in a clinical setting and to foster growth as a professional healthcare provider. One effective method of achieving this is through the utilization of Standardized Patients (SP) in education, which familiarizes students with real patient interviews and allows educators to assess their clinical performance skills. However, SP education faces challenges such as the cost of hiring actors and the shortage of professional educators to train them. In this paper, we aim to alleviate these issues by utilizing deep learning models to replace the actors. We employ the Conformer model for the implementation of the AI patient, and we develop a Korean SP scenario data generator to collect data for training responses to diagnostic questions. Our Korean SP scenario data generator is devised to generate SP scenarios based on the provided patient information, using pre-prepared questions and answers. In the AI patient training process, two types of data are employed: common data and personalized data. The common data are employed to develop natural general conversation skills, while personalized data, from the SP scenario, are utilized to learn specific clinical information relevant to a patient’s role. Based on these data, to evaluate the learning efficiency of the Conformer structure, a comparison was conducted with the Transformer using the BLEU score and WER as evaluation metrics. Experimental results showed that the Conformer-based model demonstrated a 3.92% and 6.74% improvement in BLEU and WER performance compared to the Transformer-based model, respectively. The dental AI patient for SP simulation presented in this paper has the potential to be applied to other medical and nursing fields, provided that additional data collection processes are conducted.

Kangmin Kim, Chanjun Chun, Seong-Yong Moon. 2023. "Conformer‑Based Dental AI Patient Clinical Diagnosis Simulation Using Korean Synthetic Data Generator for Multiple Standardized Patient Scenarios." Bioengineering, vol. 10, no. 5, article no. 615, May. 2023. (IF: 4.6)

talks

teaching

Teaching experience 1

Undergraduate course, University 1, Department, 2014

This is a description of a teaching experience. You can use markdown like any other post.

Teaching experience 2

Workshop, University 1, Department, 2015

This is a description of a teaching experience. You can use markdown like any other post.