Softly AI

Softly AI

We help people focus on what matters the most We build impactful, powerful, and trustworthy AI that benefits every business and individual.

We believe AI has the potential to revolutionize the way we live, work, and interact, but only if it is developed in a way that is reliable, steerable, and responsible.

10/08/2023

Our very own Jihyung Moon from Softly AI had the privilege of participating as a panelist in the discussion on “AI and Marginalized Language” at under the skillful moderation by Professor KyungHyun Cho, with esteemed colleagues: Shruti Rijhwani, Keoni Mahelona, Hady Elsahar, and Steven Bird.

The discussion was mainly about the potential concerns surrounding the rapid development of LLMs, which have been trained on a large corpus that may focus disproportionately on better-served languages, such as English and European languages. As such progress may exacerbate the issue of digital divide as well as inequality and inequity in information access for low-resource language communities, the panelists discussed the future direction of research and development to better support these underserved languages.

A range of perspectives were shared, but all panelists agreed: language is more than just text data. It's a complex system that embodies history, culture, and shared values while playing a vital role in connecting people. ChatGPT, one of the widely used language models, produces responses that OpenAI defines as helpful and beneficial, but this may not necessarily translate into benefits for non-English communities. For a language model to truly benefit the community, it must be built upon a deep understanding of the speakers who use it.

At SoftlyAI, we have also had similar concerns in the process of developing a conversational QA model that meets our users' needs. Thus, it was a great opportunity for us to be able to share our experience with the global ML community. We're deeply grateful to Professor KyungHyun Cho for allowing us to participate in the invaluable discussion, and our thanks also extend to 아산나눔재단 The Asan Nanum Foundation for giving out grants, enabling SoftlyAI to make meaningful global connections.

Softly AI의 Jihyung Moon 이 지난 7월 26일에 주관한 “AI and Marginalized Language”라는 주제의 panel discussion에 Shruti Rijhwani, Keoni Mahelona, Hady Elsahar,그리고 Steven Bird 와 함께 패널로 참석했습니다.

최근 전세계적으로 주목을 받고 있는 LLM은 주로 영어와 같은 high resource 언어를 사용해 학습되고, 그 언어와 LLM의 인프라에 쉽게 접근할 수 있는 사람들의 문화와 사회적 규범에 기반해 발전하고 있습니다. 이번 panel discussion에서는 이러한 LLM이 low resource 언어를 사용하는 사람들에게 digital divide와 정보 접근성에 대한 불평등을 더 악화시킬 수도 있다는 우려와 함께 현 상황에서 underserved language community에게 필요한 언어 모델을 어떻게 연구 개발하면 좋을지에 대해 다루었습니다.

참가한 패널들의 경험에 기반해 다양한 의견이 오갔지만, 공통적으로 패널들은 사람들에게 효용 가치를 제공하는 LLM을 개발하기 위해서는 해당 언어를 사용하는 사람들과 그들의 문화에 대한 깊은 이해가 바탕이 되어야 한다는 의견을 같이 했습니다. 언어는 단순히 텍스트 데이터가 아니라, 그 언어를 사용하는 사람들의 사고방식과 문화, 그리고 역사를 반영하고 있기 때문입니다. 예를 들어, 전세계적으로 많이 사용되는 언어 모델 중 하나인 ChatGPT는 OpenAI가 유익하다고 판단하는 정책에 맞추어 응답을 생성하지만 영어를 사용하지 않거나 선진국이 아닌 문화권에서는 다르게 느껴질 수 있습니다.

SoftlyAI도 사용자들이 기대하는 답변을 제공하는 Conversational QA 모델을 개발하기 위해 여러 고민을 하고 있는데요. 이런 고민과 생각을 Global ML community member들과 나눌 수 있는 기회를 주신 KyungHyun Cho 교수님께 감사드리고, 스타트업이 global connection을 만들 수 있도록 지원해주신 The Asan Nanum Foundation 에도 감사드립니다.

소프트리AI, 휴마트컴퍼니와 멘탈케어용 AI챗봇 개발 MOU 체결 - 머니투데이 27/07/2023

개인화된 LLM 기반의 멘탈케어 기술 고도화를 위해 SoftlyAI가 휴마트컴퍼니와 MOU를 체결했습니다!

AI가 질문의 맥락을 이해하고 적절한 답변을 생성하려면 웹 상에서 찾을 수 있는 지식 뿐만 아니라, 개인 혹은 회사에 쌓인 다양한 형태의 지식을 활용하는 것이 중요합니다. SoftlyAI는 분산되어 있는 다양한 형태의 데이터를 유연하게 참고하여 맥락에 맞는 언어를 생성하는 LLM 기반의 AI 기술을 개발합니다.

이를 통해 사전학습한 지식만을 기반으로 답변을 생성하는 상용 LLM의 한계를 극복하고, LLM이 고객사가 원하는 ‘지식 데이터’를 선택적으로 참고해서 텍스트 답변을 생성할 수 있도록 합니다.

이번 MOU를 통해 휴마트컴퍼니가 쌓은 양질의 멘탈케어 컨텐츠를 기반으로 사용자들에게 개인화된 멘탈케어를 제공하는 기술적 토대를 마련하고자 합니다.

소프트리AI, 휴마트컴퍼니와 멘탈케어용 AI챗봇 개발 MOU 체결 - 머니투데이 [이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]인공지능(AI) 기술 스타트업 소프트리에이아이(SoftlyAI)는 멘탈케어 플랫폼 기업 휴마트컴퍼니와 멘탈케....

ACL 2023 리뷰 20/07/2023

작년 겨울부터 올해 봄은 NLP 분야에서 격변의 시기였습니다. OpenAI의 GPT, Google의 Bard, Antrhopic의 Claude, 그리고 Meta의 LLaMa와 같은 초거대 언어 모델들이 AI 산업과 학계에 큰 영향을 미치고 있기 때문인데요.

그런 만큼 올해 개최된 ACL 2023에서는 자연어처리 연구자 커뮤니티가 LLM 발전에 대해 어떻게 대응했고, 어떤 새로운 연구 주제를 발굴해 의미 있는 결과를 도출 했는지 살펴볼 수 있는 좋은 기회였습니다.

이번 블로그 포스트에서는 ACL 2023에서 다룬 혁신적인 연구 동향과 흥미로운 발견들을 정리해 보았습니다. 자세한 내용은 포스트에서 확인하세요!

link: https://bit.ly/3rAkKow

ACL 2023 리뷰 2022년 겨울부터 2023년 봄은 NLP 분야에서 격변의 시기였습니다. OpenAI가 공개한 InstructGPT, ChatGPT, GPT-4와 같이 사람의 요청사항을 이해하는 초거대 언어모델 (Large Language Model, 이하 LLM) 이 보여준 능력은 AI 산업계 뿐만 아니라 AI 학.....

데이터 5개만 있어도 우리 서비스에 AI 도입이 가능해진 이유 01/06/2023

AI 도입을 위해 대량의 데이터가 필요하다는 고정관념, 이제는 버려도 괜찮습니다! 거대 언어 모델 (LLM)의 상용화로 인해 우리 서비스에 AI를 도입하는 것이 이전보다 훨씬 쉬워졌기 때문인데요.

이런 변화는 비즈니스에 AI를 활용하는 과정을 훨씬 간소화하면서, 다양한 기업들이 AI 솔루션을 더욱 쉽게 접근할 수 있게 해주었습니다.

LLM을 활용해 데이터 5개만 있어도 우리 서비스에 AI를 도입하는 방법이 궁금하시다면, 저희 최신 블로그 포스트를 확인해보세요!

link:

데이터 5개만 있어도 우리 서비스에 AI 도입이 가능해진 이유 LLM의 상용화와 함께 AI 솔루션을 적용하는 데 있어서 주요한 경제적, 기술적 진입장벽으로 작용했던 대량의 고품질 데이터셋 확보의 필요성이 대폭 줄어들었습니다. LLM을 활용하게 되면 기업이 AI를 비즈니스에 활용하기 위해 .....

15/05/2023

생성 AI를 활용해 비즈니스 문제를 해결하기 위해선 전문 지식이 필요합니다. 그러나 AI 전문가를 채용해 자체 개발하는 것은 투자대비 불확실성이 높습니다.

트로스트는 누구나 손쉽게 정신건강을 관리하고, 스스로 진단할 수 있는 서비스입니다. 트로스트는 사람들이 더 쉽게 전문가에게 심리상담을 받을 수 있게 하기 위해 양질의 리뷰 데이터를 활용하고 있는데요. 사용자들이 처음 심리 상담을 받기 더 편하게 하기 위해 SoftlyAI를 통해 상담에 대한 지식과 사용자가 경험하는 트로스트 서비스(텍스트 기반 비대면 상담)의 특징을 고려한 AI 모델을 제작하였으며, 다양한 시도를 하기위해 준비중에 있습니다.

ChatGPT와 같은 생성형 AI 도입을 고려하고 있거나, 비즈니스를 위한 AI에 대한 고민이 있는 분이라면, 저희 최신 블로그 포스트에서 트로스트 사례를 통해 AI가 어떻게 비즈니스 문제를 해결할 수 있는지 SoftlyAI와 함께 탐색해보세요!

link: https://bit.ly/3BrKdlN

Towards standardizing Korean Grammatical Error Correction: Datasets and Annotation 04/05/2023

SoftlyAI의 SungJoon Park와 Gyutae Kim이 공동저자로 참여한 논문 “Towards standardizing Korean Grammatical Error Correction: Datasets and Annotation”이 ACL 2023에 Main Track으로 Accept 되었습니다!

이 논문은 한국어가 지닌 복잡성 때문에 달성하기 어려운 한국어 문법 오류 교정(Grammatical Error Correction, GEC)을 위해 다양한 오류 유형을 포괄하는 데이터셋 구축 및 한국어 자동 문법적 오류 주석 시스템(KAGAS)를 개발하고, 이를 기반으로 학습한(fine-tuned) 모델을 공개합니다.

결과적으로, 우리 데이터셋으로 훈련된 모델은 공개적으로 제공되는 통계 기반 문법 오류 교정 시스템(Hanspell)보다 다양한 오류 유형에서 훨씬 우수한 성능을 보여주었는데요, 해당 논문을 통해 자세한 내용 확인해 보세요!

We are excited to announce that the paper "Towards Standardizing Korean Grammatical Error Correction: Datasets and Annotation," co-authored by SoftlyAI’s SungJoon Park and Gyutae Kim, has been accepted as a Main Track paper at ACL 2023!

This paper focuses on the challenging task of Korean grammatical error correction, which is difficult to achieve due to the complexity of the Korean language. We have developed a comprehensive dataset that covers various error types and created the Korean Automatic Grammatical Error Annotation System (KAGAS). Utilizing this system, we offer fine-tuned models for improved performance.

As a result, our models trained on this dataset have demonstrated significantly better performance across a wide range of error types compared to the publicly available, statistical-based GEC system (Hanspell). Dive into the details of this paper to learn more!

link: https://arxiv.org/abs/2210.14389

Towards standardizing Korean Grammatical Error Correction: Datasets and Annotation Research on Korean grammatical error correction (GEC) is limited compared to other major languages such as English and Chinese. We attribute this problematic circumstance to the lack of a carefully designed evaluation benchmark for Korean. Thus, in this work, we first collect three datasets from dif...

AI 기반의 자동화된 컨텐츠 검수 25/04/2023

AI 기반의 자동화된 컨텐츠 검수가 점점 더 중요해지고 있습니다. 하지만 도메인, 국가, 문화권의 차이로 인해 기존의 Moderation AI 모델들의 탐지 성능이 떨어질 수 있죠.

따라서 사용자의 문화와 서비스 목적을 고려한 Custom Moderation AI가 필요한 시점입니다. 이를 통해 효율적이고 정확한 컨텐츠 검수가 가능해집니다.

자세한 내용을 알아보고 싶다면, 저희 블로그 포스트에서 Custom Moderation AI의 필요성과 그 이유를 확인해보세요!
포스트 보러가기:

AI 기반의 자동화된 컨텐츠 검수 기존의 Moderation AI 모델들은 각각의 사용 목적과 맥락에 맞게 학습되어 있지만, 도메인이나 국가, 문화권의 차이로 인해 탐지 성능이 떨어질 수 있습니다. 영미권 이외의 국가에서 사용되는 단어, 이모지, 논쟁이 되는 발언 등의 ...

KOLD: Korean Offensive Language Dataset 18/04/2023

AI와 함께 세상이 빠르게 변화하고 있지만, 그와 동시에 인공지능의 책임도 커지고 있습니다. 특히, 텍스트 생성 AI에게는 각별한 주의가 필요한데요.

한국어 AI 모델도 다양한 곳에 활용되고 있지만, 영어 모델에 비해 편향이나 혐오 발언 등에 대한 고려가 부족한 상황입니다. 이에 SoftlyAI는 믿을 수 있는 한국어 언어 모델 개발을 위해 KOLD: Korean Offensive Language Dataset을 개발하였습니다.

이 프로젝트를 통해 개선된 한국어 AI 모델은 보다 안전하고 효과적인 활용이 가능합니다. 저희 최신 블로그 포스트에서 EMNLP 학회에 출판된 연구 결과를 확인해보세요!
포스트 보러가기:

KOLD: Korean Offensive Language Dataset 인공지능이 점점 더 보편화되는만큼 인공지능이 보여주는 결과에 대한 책임 또한 커지고 있고, 특히 텍스트를 생성하는 인공지능의 경우, 정보를 더 직접적으로 전달하는 만큼 더 각별한 주의가 필요합니다. 우리나라에서도 한...

ChatGPT에 대한 이해와 비즈니스 활용 방식 15/04/2023

ChatGPT가 무엇인지, 어떻게 우리 비즈니스에 활용할 수 있는지 궁금하신가요?
비즈니스 방식을 변화시키는 최첨단 언어 모델인 ChatGPT에 대해 더 배워보세요.

최근 SoftlyAI는 고객사의 ChatGPT에 대한 궁금증을 해소하기 위해 세미나를 진행했는데요. 세미나에서는 정보 추출, 언어 번역, 글 작성 등 ChatGPT가 제공하는 기본적인 기능들을 비즈니스에서 잘 활용할 수 있는 방법과 다양한 활용 사례를 제시했습니다. 또한, 언어 모델이 무엇인지, ChatGPT가 어떻게 학습되는지를 설명하며 비즈니스 적용 시 주의해야 할 사항들을 설명드렸습니다.

ChatGPT의 가능성과 비즈니스에 어떻게 적용할 수 있는지 궁금하다면, 저희 최신 블로그 포스트에서 세미나 내용을 요약해놓았으니 확인해보세요.

ChatGPT에 대한 이해와 비즈니스 활용 방식 ChatGPT의 등장 이전에도 AI가 여러 서비스에 적용되어왔지만 ChatGPT만큼 업무와 일상, 비즈니스에 강력한 영향을 미치는 인공지능 모델은 없었습니다. 이와 같은 변화 속에서 ChatGPT를 업무와 비즈니스에 더욱 잘 활용하고 싶은 분....

SoftlyAI Careers 31/08/2022

softly.ai 가 22년 6월 TIPS에 선정되었습니다: https://www.venturesquare.net/861977

이번 지원사업 선정을 계기로 AI 모델 성능 고도화를 위한 동력을 확보할 수 있게 되었습니다!

저희 팀은 현재 개발 중인 서비스에 대해 사용자 피드백을 수집하기 위해 베타 테스트 준비에 매진 중입니다. 이번 TIPS 선정을 계기로, 저희와 함께 온라인 공간 상에서의 커뮤니케이션 문제를 함께 풀어가실 도전적인 동료 분들을 모시고자 합니다. 구체적인 내용과 팀 소개는 아래 페이지에 있습니다!

https://careers.softly.ai/

SoftlyAI Careers Beyond Asterisks We promote inclusive and safe online communication

Timeline photos 24/08/2022

We’ve been selected!

문지형 will be participating in Google for Startups Founders Academy, a skill-building mentorship program for women-led startups in APAC.

Meet the 2022 cohort here: campus.co/seoul/founders-academy/

Introducing our 2022 Founders Academy cohort of women in APAC. Meet the 10 women-led participating in the 13-week program designed to bring the best of Google to strengthen their teams: https://goo.gle/3QZSfYZ