이번 글은 한탄과 다짐이 섞인 근황 이야기입니다. 개인 웹사이트에서는 처음 쓰는 사적인 이야기인 것 같습니다.

저는 베이징 소재 공대의 컴퓨터 공학부에서 AI를 공부하고 있는 박사 과정 학생입니다. 저는 언제나 AI를 “연구”한다고 표현하지 않고 “공부”한다고 표현하는데 그건 제가 아직도 한참 삽질의 여정을 보내고 있기 때문입니다. 이유야 다양하겠지만, 개인적인 속사정 빼고 객관적으로만 봐도 당연한 결과인지도 모릅니다.

우선 저는 2020년 9월에 박사 과정을 시작하였지만 현재 (2024년 2월)까지 한국 서울에서 지내고 있습니다. 코로나 때문에 시작된 “원격 박사생” 생활이었으나, 나중에 중국에 돌아갈 여건이 되었을 때에는 개인적인 사정으로 교수님께 양해를 구하고 계속 “원격” 생활을 지속해왔습니다. 다행히 학교와 랩실 지원이 빵빵해서 GPU 등 장비를 원격으로 이용하는 데에는 문제가 없지만, 그것과 별개로 물리적으로 또 정신적으로 박사생 마인드셋을 잘 만들지 않았습니다.

또 저는, 고백하건대, 컴퓨터 공학이라는 학문에 큰 관심이 없습니다. 학사, 석사까지 컴퓨터 공학 나온 사람이 웬 뚱딴지 같은 소리냐, 하실 수도 있겠지만 사실입니다. 많은 요인으로 어찌저찌 지금의 상황까지 흘러왔지만, 사실 제 진짜 관심은 뇌과학과 생물과 같은 ‘살아 숨쉬는’ 것들에 있습니다. 그래서 ‘살아 숨쉬지 않는’ 컴퓨터를 공부하는 것은 저에게는 숨이 막히는 일이었습니다. 코딩을 배우는 것도 너무 괴로웠습니다. 그 장벽을 넘기까지 수년이 걸렸고, 아직도 코딩을 피할 수 있으면 본능적으로 피합니다. 그나마 자연어 처리 (NLP) 분야를 만나고 숨이 조금 트였던 것 같습니다. 언어라는 것도 일종의 ‘살아 숨쉬는’ 것으로 느껴졌기 때문입니다. 지금의 지도 교수님의 가르침과 신뢰 덕분에 어느새 구글에 제 이름과 학교 이름을 같이 검색하면 나름 몇몇 사이트에서 제 연구 프로필이 뜰 정도의 소소한 성과는 만들어냈습니다.

구글에 내 이름 검색을 하면..! (학교 이름 추가 필수 ㅎㅎ)

게다가 accept까지 이어진 탑 학회 및 저널 publication도 8개나 쌓였더라고요. Under review 프로세스에 있는 논문들도 몇개 더 있으니, 아마 조금씩 더 추가 될 것 같습니다.

내 이름 하의 publication 들

그런데, 혹시 눈치 채셨나요? Publication은 8개인데, 제 이름으로 1저자로 등록된 논문이 없다는 사실을요. 그 뜻은 제가 독립적으로 연구 아이디어를 짜내고, 실험을 성공적으로 직접 설계하고 진행한 적이 없다는 뜻이죠. 이렇게 컴퓨터와 친하지도 않고 무능해 보이는 제가 1저자는 내지도 않으면서 n저자로는 왜 계속 참여하냐, 하면 또 나름의 이유가 있습니다.

네. AI에 대한 흥미가 있고 없고를 떠나, 저는 연구를 좋아하는 사람인 것 같습니다. 호기심과 집요함이 타고나서 세상의 많은 것들에 기본적으로 관심이 많고 (시간이 흐름에 따라 분야는 변해왔지만) 언제나 ‘덕질’하는 대상이 있었습니다 (대부분 생물 관련이었답니다.). 그리고 또 논문에서 허점을 찾거나, 논리적으로 글을 전개해서 쓰는 작업을 즐깁니다. 이러한 제 특성이 AI 학계에서는 교수님이 주시는 일 (후배를 도와 연구를 develop 하거나, 논문의 구조를 짜는 일 등) 을 해내는 데에는 도움이 되었기 때문이죠. 그러니까 제가 직접 idea를 생각해내와서 신나게 코드를 reproduce 해보며 내 idea를 검증하는 일은 거의 일어나지 않거나 실패했지만, 연구 관련해서 시키는 일들은 꽤나 잘 수행해 왔다는 겁니다. 나름의 즐거움을 느끼기도 했고요. 논문 Rebuttal 과정도 저는 재밌습니다. 리뷰어가 던지는 질문과 지적에 논리정연하게 답변하는 과정이 재밌고, 또 거기까지가 논문 작업이라고 생각하기도 하고요. 정리하자면 스스로 뭘 주도적으로 할 만큼의 호기심과 열정이 AI 필드에서는 발현되지 않았지만, 책임감, 그리고 논리적인 글을 읽고 쓰는 것을 좋아하는 특성이 저를 여기까지 이끌고 온 것 같습니다.

어찌저찌 지금까지 오긴 했는데, 그럼 앞으로는 어떻게 살 것이냐. 네, 우선 “1저자의 장벽”은 개인적으로 빠른 시일 내에 무조건 넘겨야 하고, 또 넘길 것입니다. 그것의 가장 큰 motivation은 박사 학위이긴 합니다. 1저자 논문도 없이 박사 학위를 받을 수는 없을 테니까요. 중간에 그만두고 내가 열정을 느낄 field로 넘어갈지 말지에 대한 고민도 수 없이 많이 했지만, 마무리를 잘 해내는 것이 제 스타일과 맞는 것 같았거든요. 그간 서울살이 하면서 ‘딴짓’들 (독서, 뇌과학 코스 듣기, 토론 모임 나가기, 경제 스터디 등…)을 참 많이 병행하며 한량 같은 박사생 생활을 해왔지만, 졸업까지 1년의 시간 동안 베이징에 돌아가서 제대로 된 연구실 생활을 하며 교수님의 지도를 받고, 마침표를 제대로 찍으려 합니다. 컴퓨터 공학 박사 학위라는 마침점을 찍고 난 뒤, 제 열정을 본격적으로 찾아갈까 합니다.

교수님과 오늘 나눈 대화… 대충 박사 4년차가 “연구 어떻게 하나요” 물어보는 내용입니다. 그에 또 세심하게 답해주시는 진짜 훌륭하고 존경하는 우리 교수님…

그래서 올해 3월에는 (그렇게 미뤄왔던) 중국행이 예정되어 있습니다. 졸업까지는 약 1년의 시간이 걸리지 않을까 예상합니다. 서울에 저만의 터전을 잡아버려서 자주 왔다갔다 할 계획이긴 하지만, 교수님과의 마무리, 랩메이트들과의 마무리, 그리고 AI와의 마무리까지 잘 짓고 오겠습니다.

Avatar

Jaein Kim

I'm a Computer Science PhD candidate from South Korea, currently based in Beijing, China. My academic journey is dedicated to pioneering research in Natural Language Processing and Knowledge Graphs, striving to break new ground in these dynamic fields.

2 thoughts on “AI 박사생의 연구 삽질 여정 (현재 진행형)

  1. Avatar

    * * * Apple iPhone 15 Free: https://www.krishnaprakashan.com/upload/go.php * * * hs=fc2798f6069adb8f7eb9438a209691e3*

    asw0qm

  2. Avatar

    * * * Apple iPhone 15 Free * * * hs=fc2798f6069adb8f7eb9438a209691e3*

    ba3i1e

Comments are closed.

Recommended Posts

생물을 사랑하는 AI 박사생 이야기

요즘 듣고 있는 Coursera 뇌과학 강좌에 대해 쓰려다가 에세이가 되버린 생물을 사랑하는 AI 박사생의 이야기입니다. 🙃 지금 NLP를 공부하는 AI 박사과정 학생이지만, 제 관심사는 언제나 다른 곳을 향해 있었습니다. 어릴 때부터 지금까지 살아오면서 언제나 무언가를 키우고 있을 정도로 생물에 대한 관심이 참 […]

Entity Alignment 태스크 및 벤치마크, 데이터셋 알아보기

오늘은 Knowledge Graph (KG) 관련 태스크 중 Entity Alignment (EA)에 대해 보다 자세히 알아보겠습니다. KG 개념에 익숙하지 않으시다면 지난 글을 읽고 오시면 도움이 됩니다. 지난 글에서 간단히 소개했듯, EA는 다른 두 개 (혹은 그 이상의) KG가 가진 엔티티들 중, 실세계에서 같은 객체를 […]

지식 그래프 (Knowledge Graphs) 개념과 관련 태스크, 그리고 NLP와의 관계성

이번 글에서는 지식 그래프의 기본 개념에 대해 알아보고, 관련된 대표적인 태스크로 어떤 것들이 있는지 간단하게 알아보겠습니다. 또 KG와 NLP와의 관련성에 대해서도 간단히 소개하며 마무리하겠습니다. Knowledge Graph (KG) 기본 개념 KG는 real-world의 객체 (entity) 사이의 관계 (relation)를 그래프 형태로 모델링한 것으로, 구조화된 데이터의 […]

Self-Supervised Learning을 활용한 순차 추천시스템: S3-Rec (페이퍼 리뷰)

S3-Rec (Self-Supervised learning for Sequential Recommendation)은 2020년도에 CIKM에 발표된 Self-supervised learning 매커니즘을 활용한 순차 추천시스템 연구입니다. Recap: Self-supervised Learning Self-supervised learning (자기지도 학습)은 원시 데이터 (raw data) 내에 존재하는 상관관계에서 training signal을 구성하여 이를 통해 모델을 훈련하는 방법입니다. 그 중에서도 이 논문에서는 […]