티스토리 뷰
IMGT numbering system
항체의 IMGT 구조는 다음과 같이 되어있음 (아래 그림 참고)
A - B - BC Loop(CDR1)- C - C'- C'C'' Loop(CDR2) - C''- D - E - F - FG Loop(CDR3) - G

Figure 1에 나타난 서로다른 구조들은 다음을 의미한다.
- 초록색 선 : hydrogen bond를 형성하는 부분
- 굵은 빨간색 아미노산 : Conserved AA Residues
- 하늘색 배경색 : Hydrophobic AA Residue들이 50%이상 발견되는 부분들
- 네모 : IMGT anchor (구조 경계)
- 빗금 동그라미 : Gap
IMGT numbering system이 적용된 Ab들은 다음과 같은 특징들이 highly conserved 되어있다.
- 1st-CYS at position 23
- Conserved TRP at position 41
- Conserved hydrophobic amino acid at position 89
- 2nd-CYS at position 104
- 118번째의 F/W-G-X-G Conserved Sequence

IMGT에서는 CDR 1, 2, 3 를 bracket 안에 넣어서 [8,8,20] 처럼 표현하기도 한다고 함.
나중에 생성모델 할 때, 추론과정에서 이런 bracket을 입력해주면 저 길이에 맞는 CDR을 생성해주는 모델도 괜찮다고 생각함.
항체 numbering에는 GAP이나 Additional Position이 필요함. IMGT 역시 이런 개념이 있음
- IMGT gaps: loop가 기준 길이(BC=12, C′C″=10, FG=13)보다 짧으면 꼭대기(apex)에 gap을 넣어 대칭적으로 번호를 매김.
- 추가 positions: loop가 기준보다 길면 기존 번호를 쪼개서(예: 112.1, 112.2…) 확장.
- 의의: CDR 길이 변이가 있어도 IMGT numbering으로 일관된 alignment 확보
V Domain의 Humanization이나 Engineering을 위한 insights
1. CDR Grafting tool 중에 IMGT/DomainGapAlign이라는 툴이 있음. 이걸 사용하면 항체에서 IMGT numbering 시스템에 대해 가장 CDR 1,2,3로 적합한 부분을 선택하고 그거에 맞는 가장 적합한 human Framework Region에 grafting해준다고 함.
2. Kabat은 사용하지 말라고 함 옛날거라 별로 신뢰도가 좋지 못하다는 언급이 있음
3. FR2의 position 39과 CDR2의 position 56 또는 57 사이에는 Highly Conserved Hydrogen Bond가 존재함
4. FR2의 position 40과 CDR3의 position 105에도 Highly Conserved Hydrogen Bond가 존재함
이 두개의 hydrogen bond는 반드시 보존되어야 cdr loop의 안정성을 확보할 수 있다고 함
5. CDR3의 position 106번째의 R (Arg, 아르기닌)과 position 116의 D(Asp, 아스팔탐산) Conserved Salt Bridge를 형성함
이것도 CDR3 loop의 안정성을 강화한다고 함
6. IMGT/3Dstructure-DB Contact Analysis를 이용하면 항체와 리간드 사이에서 원자수준의 결합을 확인해준다고 한다.
7. IMGT에서는 AA Residue별로 다음과 같은 특성을 지정하였다.

이 AA Residue들의 특성을 이용해서 아미노산의 치환을 할 때, 동일한 성질을 가지는 것들은 (+)로, 다른 성질로 변환되는 경우에는 (-)를 이용해서 성질들이 얼마나 변했는지를 4가지의 클래스로 나눈다고 한다.
- 매우 유사함 ( + + + )
- 유사함 ( + - + , + + - )
- 다름 ( - - +, - + -, + - - )
- 매우 다름 ( - - - )
이건 나름 괜찮은 정보같다. DDPM 기반으로 AA Residue의 치환 과정에서 치환될 아미노산의 성질을 condition으로 주는 방법으로 사용할 수 있을 것 같다. 조금 더 생각해보면 좋겠다.
8. CDR의 아스파라긴 (Asn, N) Residue들의 deamination은 좋지 못한 역할을 한다.
9. CDR의 아스팔탐산(Asp, D)의 이성질체화는 mAb의 CDRs의 flexibility와 exposure 레벨 증가하는 특성에 의해 CDR에서 자주 발견되는데, 이것은 Binding Affinity를 낮추는 것으로 알려져있다.
Asp와 isoAsp는 딱히 charge change는 없기 때문에 결합 구조의 차이가 원인이 되는 것 같다고 한다. 특히 backbone peptide에 methyl group이 들어오는 것이 주된 원인 같다고 생각된단다.
10. CDR내의 succinimide의 존재는 좋지 못한 특성을 갖는다. (decrease in potency) 아스파라긴(Asn, N)의 deamination과 아스팔탐산(Asp, D)의 이성질체화 중간산물로 succinimide가 생성되는데 따라서 CDR 내부에는 Asn이나 Asp는 피하는 것이 좋겠다.
11. 항체에서 특히 CDR2 나 FR의 Met의 Oxidation이 많이 발견되었는데 이런 산화반응은 썩 좋지 결과를 낳는다. Met과 마찬가지로 Trp도 산화 취약 잔기로 분류되며 reduced potency, decreased thermal stability, and increased aggregation propensity등 다방면으로 좋지 못한 특성 변화의 원인이라고 한다. 특히 사람의 몸에서 약물로 사용되기 위해서는 혈관에서 순환하며 오랜 시간 산화 스트레스에 노출되므로 CDR에는 Met이나 Trp의 비율을 낮추는 것이 권장된다.
12. 보통 항체 구조학에서는 Cys Residue는 잘 알려진 intra-, inter-chain disulfide bond(S-S, 이황화 결합은 보통 2.0–2.2 Å)를 형성한 채로 존재하는 것이 정설인데, 그렇지 않고 free Cys 형태로 존재하는 경우도 있다. 다음과 같은 비정상(?) 적인 Cys 관련 구조들이 존재한다고 한다.
- free Cys
- alternative disulfide bond linkage (scrambling)
- trisulfide bonding
- the formation of thioether
- cysteine racemization.
아무튼, HC-LC이 존재하는 IgG에서는 CDR에는 Cys가 존재하면 썩 좋지 못하다고 보여지지만, 반대로 낙타류의 VHH에서는 CDR1-CDR3의 disulfide bond가 존재하는 경우가 많다고 한다. 정확히 어느 위치에 존재하는지는 알아봐야겠다.
예외도 있다. ADC등을 만들기 위해서는 의도적으로 Cys를 넣는 경우도 있다고 한다. 그러나 일반적인 통념은 CDR 부위의 Cys는 좋지 못하다고 생각하는 것이 맞는 듯하다.
13. Glycosylation(당화)는 N-X-S/T로 구성된 서열이며, 보통의 의학 항체 공학 통념상으로는 CDR부위의 당화 서열은 의도하지 않은 글라이코폼들의 부착으로 인해 항원 결합에 좋지 못한 영향을 주는 경우가 많다. 그러나 반드시 그렇다고 말할 수는 없기 때문에 조건부 생성을 통해 당화된 서열이 존재하는 데이터에 따로 conditional label을 부여하여 학습하고 아주 적은 양만 CDR에 당화된 서열을 생성하도록 하는 정도의 학습 방법은 유효하겠다.
14. 치료용 항체가 가져야 할 이상적인 전하의 기준은 '건강한 사람의 혈액 속에 존재하는 자연적인 항체들(poly IgG)의 전하 범위'이다. 전하와 전하 분포는 protein solubility와 solution viscosity(점도, Aggregation 특성)에 매우 밀접한 연관이 있다.
15. CDR이나 FR에 국소적으로 매우 강한 양전하 또는 음전하 패치(patch)가 생기지 않도록 해야한다. 전체적으로 뜨문뜨문 음전하를 띠는 잔기와 양전하를 띠는 잔기를 섞어가며 모자이크식으로 배치하여 Variable Region이 전체적으로 약한 음전하 또는 양전하를 띠도록 유도해서 서로에 대한 net repulsion을 유도하는 것이 중요하다. 안그러면 CDR 부위가 자기들끼리 엉겨붙는 Aggregation이 나타날 수 있다.
16. CDR은 일반적으로 pH 7.4 (신체의 일반적 기준) 약한 음전하를 띠도록 설계하는 것이 좋다. 그 이유는 일반적으로 우리 몸에서 자연적으로 생성되어 발견되는 IgG들의 CDR이 약한 음전하를 띠는 경우가 많으며, 또 세포들의 표면들이 보통 음전하를 띠고 있기 때문에 강한 양전하를 띠는 항체들은 CDR이 원하지 않는 세포에 비특이적으로 무작위 결합을 할 가능성을 높인다.
때로는 CDR이 양전하를 띠도록 하는 경우도 있는데 결합 목표 항원이 강한 음전하를 띠는 경우등이 그렇다. 예를들어 BBBP를 위해서는 오히려 반대로 CDR이 강한 양전하를 띠도록 유도하는 것이 더 전략적인 선택이 될 수도 있다. 다만 말한대로 혈뇌장벽 뿐 아니라 일반적인 모든 세포 표면에 비특이적으로 결합할 가능성이 높기 때문에 아주 어려운 문제라고 볼 수 있음.
생성 모델에 적용하는 관점 (Gemini 요약)
사용자의 생성 모델에 이 전략을 적용한다면, 모델의 손실 함수(loss function)나 보상 함수(reward function)를 다음과 같이 복합적으로 설계할 수 있습니다.
- 항원 결합력 (Affinity): 당연히 가장 기본이 되는 목표입니다. (Term 1)
- 전하 패치 페널티 (Charge Patch Penalty): 생성된 항체 Fv의 3D 구조를 예측한 뒤, 표면에서 가장 큰 양전하/음전하 클러스터(패치)의 크기를 계산하여, 이 값이 특정 임계치를 넘으면 강한 페널티를 부여합니다. (Term 2 for Global Harmony)
- CDR 전하 보상 (CDR Charge Reward): 생성된 CDR 서열의 아미노산 조성을 바탕으로 pH 7.4에서의 알짜 전하(net charge)를 계산하고, 이 값이 목표 범위(예: -2에서 -5 사이) 안에 들어올 때 보상을 부여합니다. (Term 3 for CDR Fine-tuning)
Mosaic Score of Global Charge (MSGC) 방법을 고안해보자, 전체적으로 전하가 평이하게 퍼져있으면서도 특히 CDR 부위에 국한해서는 약한 음전하를 띠도록 유도하는 objective function을 고안해보자.
17. 정전기적 특성 뿐 아니라 소수성 아미노산들의 강한 패치가 형성되지 않도록 하는 것도 중요하다.
단백질 표면에 친수성 아미노산(D, E, K, R, H, N, Q, S, T 등)이 많으면 물 분자와 잘 상호작용하여 안정적으로 녹아있을 수 있음 즉, 기본적으로 표면의 친수성은 용해도를 높이고 응집을 막아주는 좋은 특성임. 반면 소수성은 그렇지 않음 표면에 노출된 소수성 아미노산(W, F, Y, L, I, V, M 등)이 넓은 패치를 형성하면 이 소수성 잔기들끼리 서로 달라붙어 응집을 유발할 수 있음.
18. 모델의 학습에 서열 기반으로 빠르게 전하의 근사값을 계산하고 어느 정도 원하는 charge 값을 위주로 서열을 생성할 수 있도록 Loss function을 추가해 학습을 유도하는 것이 유효할 수 있다.
특히 완성된 항체의 구조를 3D로 변환하고 Debye–Hückel–Henry charge(Z_DHH 또는 Effective Charge)값을 계산하는 파이프라인을 구축하면 정확환 표면 전하 분포를 고려한 전체 항체의 전하값 Z_DHH를 계산할 수 있는데 Z_DHH 계산에는 장비에 의한 실험값이 필요해서 computational method로 계산하는건 현실적으로 불가능하다.
[IgG Charge: Practical and Biological Implications] 논문을 참고하면 단순 서열을 가지고 계산한 Z_cal 값도 Z_DHH값에 대하여 pH 5.0 acetate환경과 pH 7.4 PBS환경에서 그 결과가 양의 상관성을 보이는 것을 봤다고 하니 서열 기반의 Z_cal 값을 이용해도 어느 정도 reasonable한 수준의 Condition으로는 사용할 수 있을 것으로 기대된다.

다만 서열 기반의 예측은 항상 정확성이 뒤떨어지므로 후보군 생성 및 필터링 단계에서 구조기반의 철저한 검증을 통해 좋은 데이터를 걸러낼 수 있어야 하겠다.
19. 일반적인 인간 VH는 VL과 결합하는 인터페이스가 소수성(hydrophobic)이지만, VHH는 이 부분에 친수성(hydrophilic) 아미노산을 가지고 있다. 이 특성을 '카멜화(Camelisation)'라고 부르며, 인공적인 인간 단일 도메인 항체(dAb)를 만들 때 모방하는 핵심 원리이다. VH-VL 결합 인터페이스를 확인하고 실제로 소수성 잔기들로 구성되어있는지 확인해보는 평가메트릭이 사용가능 할 수 있겠다.
20. 나노바디는 여러모로 좋은 특성들을 가진다. 그러나 작은 크기 때문에 renal clearance에 대한 저항성이 낮아 혈액에서 2h 정도의 반감기로 매우 빠르게 제거당한다. 그래도 이런 짧은 반감기 특성은 인위적인 Fc를 달아주거나 Albumin등의 추가 등의 항체공학 방법을 통해서 보완이 가능하다.
21. 이거는 다른 논문을 보다 갑자기 생각난건데, VH-VL의 상호 배향 (Mutual Orientation)을 고려하는 컨디션 모델링도 좋은 방법이 될 수 있지 않을까? 라는 생각을 해봤다. CDR을 생성하는 것 뿐 아니라, VH-VL의 pairing interface에 따라 항원과의 Affinity가 크게 변할 수 있다는 연구결과가 있다. 이 사실을 기억하고 단순히 CDR 서열 구조 생성만이 항원과의 interaction을 결정짓는 것이 아니라는 것을 기억하자.
'Background > Biology' 카테고리의 다른 글
| 나노바디 생산 및 디자인 가이드 (0) | 2025.02.07 |
|---|---|
| 나노바디 (Nanobody)리뷰 (2) 생물/화학적 특징 (0) | 2025.02.06 |
| 나노바디 (Nanobody)리뷰 (1) 구조적 특징 (0) | 2025.02.03 |
| Antibody Antigen Generative Modeling (3) Modularity (0) | 2025.01.31 |
| Antibody Antigen Generative Modeling (2) Learnability (0) | 2025.01.28 |
- Total
- Today
- Yesterday
- 나노바디
- 3b1b
- dataloader
- 파이썬
- 항원항체결합예측모델
- 이왜안
- MatrixAlgebra
- nanobody
- 최대우도추정
- Manimlibrary
- 3B1B따라잡기
- 베이즈정리
- Matrix algebra
- antigen antibody interaction prediction
- 기계학습
- ai신약개발
- 백준
- elementry matrix
- manimtutorial
- 오일석기계학습
- 인공지능
- 선형대수
- marginal likelihood
- MorganCircularfingerprint
- eigenvector
- manim library
- eigenvalue
- manim
- 논문리뷰
- MLE
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | ||||
| 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 11 | 12 | 13 | 14 | 15 | 16 | 17 |
| 18 | 19 | 20 | 21 | 22 | 23 | 24 |
| 25 | 26 | 27 | 28 | 29 | 30 | 31 |