Transfer Learning with a mixture of self-supervised experts

1 minute read

Federated Learning과 유사한 환경에서 Transfer Learning에서 Active Learning과 유사하게 Data를 가져오는 문제를 풀고자 하였음¹

tl_fl

요약

문제는 Federated Learning과 유사하다면 유사할수도 있는데, Decentralized Learner가 각기 다른 환경에서 Central Server와 communication을 통해 학습을 진행하는 것이다.
그런데, FL에서는 Server가 데이터를 가지고 있지 않다면, 여기에서는 Server에서 추가적인 데이터를 왕창 가지고 있다는 점이다. 그리고 Learners는 Server에 어떤 데이터를 달라고 할지를 요청해야 하는 상황으로 바뀌었다.
여기서 요청을 한다는 점에서 Active Learning 적인 요소가 들어와있으나, 본 논문에서는 직접적인 비교를 하지 않았고 따라서 Reviews도 그 부분에서 있어서 부족하다고 지적하였다.
Base Model은 Server에서 해당 데이터들을 이용해서 학습이 이루어진다. Pre-Trained Base Model은 모든 Learners에게로 전달이 되고, Local의 Learner는 자기가 가지고 있는 데이터와 비교를 하여 Central에 있는 데이터 중 어느 데이터를 추가로 가져와야할지를 결정하게 된다.
이때 Base Model은 본 논문의 제목과 같이 Mixture of Experts 형식으로 학습이 된다.