본문 바로가기
728x90
반응형

전체 글190

LightGCN Abstract GCN의 경우 협업필터링에 있어서 새로운 state-of-arts 로 등극했지만! 추천하는데 있어서 효율성에 있어서는 이해가 잘 되지 않는 경우가 많다고 할 수 있음! GCN의 특징인 feature transformation and nonlinear activation 는 협업필터링 성능 향상에 기여를 별로 못하기도 하고, 추천성능도 그닥 안좋고, 학습하기도 까다로운 츼명적인 단점이 있음. 이 연구에선 GCN 디자인을 심플하게 하고, 추천에 있어서 정확하고 간결한 모델을 만드는데 그 목적이 있음! 특히 LightGCN은 사용자와 아이템 상호작용 그래프로 선형적으로 순전파하면서 사용자와 아이템 임베딩을 학습한다. 마지막 임베딩으로 모든 레이어에 대해 학습된 임베딩의 가중합을 사용한다. 1... 2023. 2. 12.
리펙터링 1장. 함수추출하기: 프로그램에 새로운 기능을 추가하기 편한 구조가 아닌 경우에 새로운 기능을 추가하려면 먼저 기능을 추가하기 쉬운 형태로 리펙터링한 후 기능을 추가하라. 별도의 함수로 쪼갤 때, 반복해서 바뀌는 변수의 경우 함수호출시 초기화를 하도록 하라. 조금씩 변경하고 매번 테스트하는 것은 리팩터링 절차의 핵심이다. 매개변수 역할이 뚜렷하게 나타나지 않으면 a/an을 붙여 바꾸면 유용하다. 변수 인라인하기: 임시 변수를 질의 함수로 바꿔 로컬 범위에 존재하는 이름이 많아지지 않도록 하라. 반복문에서 변수 값이 각각 누적될 때, 반복문을 쪼개면 리팩터링하기가 더 수월해진다. 함수선언바꾸기: 함수 이름 변경 책: 리팩터링 2판) 2023. 2. 7.
추천시스템. 염두에 둘 것. 추천시스템을 적용할 때 고려해야 할 사항. - 콘텐츠가 많은 경우 특정 카테고리의 콘텐츠에 대한 정보로 다른 카테고리 콘텐츠 추천에 적용하는 경우에 주의해야 한다. 적용하는 경우 카테고리 간의 관계를 고려해야 한다. - 작은 데이터로 실험하되, 추천알고리즘의 갱신주기, 계산복잡도를 현실적으로 커버할 수 있는지 고려해야 한다. - 사용자 선호도를 나타내는 로그가 많다면 그 많은 복잡한 정보를 모두 수용할만한 복잡한 알고리즘이 필요할 수 있다. - 사용자에 대한 패드백은 개개인별로 상대적인 값이므로 절대적으로 비교하기 보다 이러한 상대성을 고려하면 좋다. - MF의 경우 예측값을 뽑기 위해서 데이터 전체를 넣어서 dense matrix를 만들어 추천리스트를 생성한다. - 새로운 사용자나 새로운 콘텐츠가 들어.. 2022. 11. 20.
추천시스템 기술 요약 추천시스템을 적용하는 일에 뛰어들기에 앞서 팀원들과 함께 추천시스템 관련 서적~ 강의~ 컴퍼티션 등에 참가해 적극적으로 공부중이다! 지금은 전체적으로 한번 아우르는 좋은 강의를 공유받아 강의를 듣고 짧게만 요약을 해보았다! 강의 설명이 너무 친절하고 코드가 간결해서 입문으로 정말 추천하고 싶은 강의다! 👍👍👍👍 연관분석 - 상품사이에 어떤 연관이 있는지 찾는 알고리즘. 장바구니에 동시에 담긴 아이템들의 연관성을 본다하여 장바구니 분석이라고 표현한다. 연관분석은 얼마나 자주 같이 구매되는가? A를 구매한 사람이 B를 구매하는가? 에 초점을 맞춘다. - 가능한 모든 경우의 수를 탐색해 지지도, 신뢰도, 향상도(연관규칙 평가지표)가 높은 규칙을 찾아내는 방식으로 규칙을 생성한다. - 단점은 아이템이 증가하면 .. 2022. 11. 13.
Deep Clustering for Unsupervised Learning of Visual Features 어쩌다 알게된 .. ~.~ 논문 Deep Clustering for Unsupervised Learning of Visual Features 리뷰. 본 논문에서는 주장하는 기여점은 크게 4가지라고 주장한다. 첫째, k-means와 같은 표준 클러스터링 알고리즘과 함께 작동하는 convnets의 end-to-end학습을 위한 최소한의 단계만을 필요로하는 새로운 USL(UnSupervised Learning) 방법이라는 것. 둘째, USL을 사용하는 많은 표준 transfer task에 대해 SOTA성능을 지닌다는 것. 셋째, 정해져있지 않은 이미지 분포에 대한 학습을 진행할 때, 이전 SOTA 보다 나은 성능을 지닌다는 것. 넷째, USL 피쳐 학습에서 현재 평가 프로토콜에 대한 토의를 함. 1. Intr.. 2022. 11. 12.
BertSum 뉴스 추출 요약 모델 추출요약(Extractive Summarization)은 문서에서 가장 중요하다고 판단되는 k 개의 문장을 순서대로 나열하여 요약합니다. BERT(Bidirectional Encoder Representation using Transformer)는 MLM과 NSP로 학습한 임베딩 모델 기존 BERT의 경우 Masked Language Modeling 으로 단어에 대한 representation을 산출하며, Nest Sentence Prediction 방법으로 두 개의 문장을 입력받도록 구성된 모델입니다. 그리고 오픈된 시중의 BERT류의 모델은 positional Embeddings의 max size는 512로 고정되어 있습니다. BertSum은 Input Document 라인에서 input값을 입력 받.. 2022. 9. 15.
럭키 드로우 사내 독서카페에 비치된 책 중에서 한 권 골라서 읽었다. 현재 유투버로 좋은 말씀 공유하시는 디자이너의 길을 걸어오신 분의 에세이 이자... 성경처럼 믿음을 발생시키는 책이다. "하고 싶은 일을 명확히, 과정상 발생하는 변수들에 대해 묵묵히, 끝까지 초심을 읽지 않는 것" 정~말 뻔하고 당연하고 그럼에도 실천하지 않았던 것들을 되새기게 해준다. 언젠가부터 자기개발관련 서적에 거리를 두면서 "나는 내인생을 살거야!"를 외치며 살았는데, 나라는 사람이 살아지고는 있는 것 같은데 정말 방향이라는 것이 없는 호수 위에 가만히 떠있는 나룻배처럼 느껴졌다. 그렇다 이 책을 읽으면서 마음에 변화는 확실히 왔다. 저자분의 매체나 지금 이 책을 통해서도 많은 사람들이 각자 자신의 삶을 돌아보며 용기를 얻었을거라 생각한다.. 2022. 6. 19.
MLOps의 필요성.. "MLOps가 왜 필요할까?" 단순한 AI모델을 배포하는 것은 쉽지만 이를 계속해서 유지보수 및 고도화해나가는 것은 많은 리소스가 든다. 그 예로는 프로세스간의 종속성, 문서화, API 유지, 리팩토링(소스코드수정) 등이 있다. ML에서는 이러한 문제만 해결하는 것이 힘든 부분들이 있기 때문에 MLOps의 필요성이 부각된다. "좋은 MLOps를 구성한다는 것은 어떤 것을 고려해야하나?" 데이터의 변화가 잦고, 모델 성능 개선을 위한 재학습 그리고 도메인 상의 라벨링에 대한 피드백과 크라우드 소싱에 대한 문제는 쉽게 해결하기 힘들다. 이상적으로 ML프로그래밍을 한다는 것은 변하는 데이터셋에 유연하고, 모델도 재사용가능하기 좋아야 한다. 당연히 문제 정의도 명확히 해야한다. 추가적으로 데이터/모델에 대한 검.. 2022. 6. 15.
줌인터넷 투자 콘텐츠 서비스 포털사이트 줌인터넷이 투자 콘텐츠 서비스 강화에 힘쓰는 듯하다. 나도 그 일원으로써 ML서비스를 하나씩 담아내고 있다. 모쪼록 줌인터넷에서 제공하는 금융정보가 팩트를 기반으로! 사용자들에게 재밌고 친근하게~~ 다가갔으면 좋겠다~~ 유용한 서비스를 만들었으니 홍보를 위해 나도 이벤트에 발을 담근다~~ㅎㅎㅎ 투자를 좀 아는 사람은 아래 그림처럼 매코차트를 잘 본다고들 한다. . .(처음 알았음..) 한눈에 증시의 현황은 확실히 눈에 들어오긴 한다! 매코차트에 종목이름을 클릭하면 종목 상세정보를 볼 수 있다. 확실히 디스플레이가 큰 PC 환경에서 유용하다 느낀다. https://invest.zum.com/domestic?cm=invest_main_gnb 줌 투자 한눈에 보는 국내 해외 증시 지수 정보와 전문가.. 2022. 5. 24.
728x90
반응형