티스토리 뷰
한줄 요약 : 이상한 형태로 batchify가 되는 데이터의 타입을 확인해보고 nd.array가 아니라 list라면 nd.array로 변경하자.
class ProteinSequenceDataset(Dataset):
def __init__(self, df, tokenizer):
self.df = df
self.tokenizer = tokenizer
def __len__(self):
return len(self.df)
def __getitem__(self, item):
p = self.df.iloc[item]['Target Sequence']
s = self.df.iloc[item]['SPS']
d = self.df.iloc[item]['SMILES']
p_v = protein2emb_encoder(p)
# print(type(p_v))
s_v, s_l = SPS2emb_encoder(s)
# print(type(s_v))
d_v, d_l = drug2emb_encoder(d)
# print(type(d_v))
y = self.df.iloc[item]['Label']
return p_v, s_v, d_v, y
# return {
# 'protein_sequence': sequence,
# 'input_ids': encoding['input_ids'],
# 'attention_mask': encoding['attention_mask'],
# 'targets': torch.tensor(target, dtype=torch.long)
# }
Batch size를 4를 준 상태로 tokenization을 하는 DataLoader를 만들고 만들어진 Data를 확인해보았다. 대충 보면 알겠지만, 지금 batch의 방향이 엉뚱하게 되어있다. [21, 8, 10 ,20 ... ] 이렇게 4개가 되어야 할 것이 잘못된 방향으로 batchify를 하고 있다.
다른 친구들은 batchify가 잘 되고 있는데 유독 하나만 그렇길래 왜그런지 한참을 고민했는데 이럴때는 엉뚱하게 batchify 되어 출력되는 데이터의 type을 확인해보자 혹시 nd.array가 아니라 list형태로 되어있다면 이런 잘못된 방향으로의 batchify가 나타날 수 있다.
해당 문제를 일으키는 데이터의 타입을 nd.array로 변경한 뒤 다시 시도해보니 정상적으로 batchify가 되는 것을 확인할 수 있었다.
'Computer > 코딩 개꿀팁' 카테고리의 다른 글
[꿀팁] conda 환경에서 pip를 사용할 때 conda 환경에 설치되는게 맞는지 불안하다면? (1) | 2023.07.27 |
---|---|
[꿀팁] rdkit Morgan Circular Fingerprint를 CSV등의 엑셀 파일로 export할때는 string형태로 변환한 뒤에 Export하자 (0) | 2023.07.25 |
[꿀팁] VS code에서 terminal PowerShell에서 CMD로 변경하기 (0) | 2023.07.19 |
어어 점마 와이라노? VS code에서 Tab키가 안먹을 때 (0) | 2023.07.06 |
[꿀팁] 윈도우에서 전용 GPU 메모리 초기화 하기 : torch.cuda.empty_cache() 아님! (0) | 2023.06.30 |
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
TAG
- manimtutorial
- 최대우도추정
- eigenvalue
- manim library
- variational autoencoder
- kl divergence
- MLE
- 이왜안
- MatrixAlgebra
- 선형대수
- 제한볼츠만머신
- ai인공지능
- 파이썬
- manim
- 3b1b
- kld
- MorganCircularfingerprint
- marginal likelihood
- 3B1B따라잡기
- Matrix algebra
- 베이즈정리
- 백준
- 기계학습
- Manimlibrary
- 인공지능
- vae
- 오일석기계학습
- eigenvector
- ai신약개발
- elementry matrix
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
글 보관함