티스토리 뷰

위와 같이 padding mask나 triangular mask를 만들 때, device를 항상 잘 설정해줘야 한다.

그렇지 않으면 모델은 cuda에, mask는 cpu에 존재해서 모델이 돌아가지 않을 수 있다.

tgt_mask뿐 아니라 모든 mask의 device를 모델과 같은 device에 설정했는지 확인해보자

댓글