'nlp' 태그의 글 목록

nlp 5

[NLP] Semantics and Sentiment: Cross-lingual Variations in Emoji Use Review | 논문 리뷰

오늘 리뷰할 논문은EMNLP 2024"Semantics and Sentiment: Cross-lingual Variations in Emoji Use" 입니다.요즘 텍스트에서 이모지를 어떻게 처리하는지에 관해 실험중인데,이 논문이 여러가지 언어를 기반으로 실험을 꼼꼼하게 잘해서 리뷰하게 되었습니다. 1. IntroductionCMC(Computer-Mediated Communication)에 대해 설명하며 시작합니다.컴퓨터 매개 통신은 텍스트 기반 소통이라는 것인데, 주로 트위터나 각종 메신저 앱, DM과 같이 오로지 텍스트로 소통을 하는 앱을 의미합니다. 이런 소통 방식은 아무래도 억양이나 몸짓과 같은 비언어적 요소가 부족하기 마련인데요.이런 소통 방식에서 이모지가 대화의 의도나 감정을 효과적으로 전..

논문/리뷰 2024.12.18

[딥러닝][BERT] BertTokenizer 정리 | BERT 공부하기

Bert-Tokenizer tokenizer 정의 : 주어진 corpus에서 토큰이라 불리는 단위로 나누는 작업임. berttokenizer의 특별한 점. wordpiece tokenizer(BPE의 변형 알고리즘) 적용 BPE(Byte Pair Encoding): OOV(OUT-OF-VOCA) 문제를 완화하기위한 대표적인 서브워드 분리 알고리즘 서브워드 분리(subword segmenation); 하나의 단어는 더 작은 단위의 의미있는 여러 서브워드들(workplace = work + place)조합으로 구성된 경우가 많음. 이같은 하나의 단어를 서브워드로 분리해 인코딩 & 임베딩하기 위한 전처리 작업. Tokenizer의 input과 output input 텍스트 (List[str]), 리스트 형태로..

이론/NLP 2023.07.20

[NLP] Analysis of sentiment in tweets addressed to a single domain-specific Twitter account: Comparison of model performance and explainability of predictions Review | 논문 리뷰

안녕하세요. 오늘 리뷰해볼 논문은 "Analysis of sentiment in tweets addressed to a single domain-specific Twitter account: Comparison of model performance and explainability of predictions" 제가 이해한 바로는 Feature Extraction에 관한 다양한 방법을 직접 실험해보고 가장 좋은 성능을 얻어 내는 방법을 탐구해나가는 논문 같았습니다. 서로 다른 기계학습 모델의 성능을 평가방법을 제안하고 비교하면서 마지막장에서는 시각화 하는 방법도 제안합니다. 왜 같았습니다....냐면... 뭔가 이해가 잘 안되었거든요. 글의 짜임새나 내용의 흐름은 좋은데 그래서...뭘 한건가 싶은 느낌. 하..

논문/리뷰 2023.04.25

[NLP] TOXIGEN: A Large-Scale Machine-Generated Dataset for Adversarial and Implicit Hate Speech Detection Review | 논문 리뷰

안녕하세요. 쏘오금입니다. 오늘 리뷰할 논문은 TOXIGEN: A Large-Scale Machine-Generated Dataset for Adversarial and Implicit Hate Speech Detection로 적대적이고 은유에 비유된 혐오표현을 감지하고 생성한 데이터 세트에 관한 논문입니다. 독성언어 탐지 시스템은 종종 소수자 표현이 함유된 문장을 독성 언어가 포함되었다고 잘못 표기하곤 합니다. 이런 시스템의 허점들을 방지하고자 독성 언어 표현 생성에 대한 연구가 깊어지고 있는데요. TOXIGEN은 이런 상황에서 빛처럼 등장한 현재까지 가장 큰 혐오 텍스트 탐지 데이터 셋입니다. 리뷰는 제가 이해하기 편한 방식으로 구성되었으니 자세한 이해를 원하시는 분들은 링크 속 논문과 글 하단에 있..

논문/리뷰 2023.03.28

[NLP] INFOBERT: IMPROVING ROBUSTNESS OF LANGUAGE MODELS FROM AN INFORMATION THEORETIC PERSPECTIVE Review | 논문 리뷰

#INFOBERT https://github.com/AI-secure/InfoBERT

논문/리뷰 2023.01.10

sew_Code_ SALT

안녕하세요. NLP 논문 리뷰가 주로 올라옵니다. Python도 하고 R도 합니다.

deeplearning, 편향제거, bert 편향, nlp paper, acl 2023, bert 토크나이저, 편향 제거의 효과, BERT 정의, nlp, 딥러닝, nlp 논문리뷰, bestpaper, emnlp, BERT, deeplearing, 과학 논문, Adversarial, NLP 논문, emnlp2024, sentiment,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

nlp 5

티스토리툴바