티스토리 뷰
https://pubmed.ncbi.nlm.nih.gov/35293269/
3. Capacity to modularly learn antibody design parameters
3.1. Modularity of antibodies and developability parameters
약물로서 사용 가능한 mAb(monoclonal Antibody)를 생산하기 위해서는 여러가지 고려해야 할 developability가 필요하다. 여기서 말하는 developability는 clinical trials를 통과할 수 있는 Ab가 되기 위한 다양한 biophysical properties를 고려해야 한다는 의미로 저자는 특히 다음과 같은 특성을 고려해야 한다고 언급했다.
- Aggregation
- Stability
- Immunogenicity
- Half-life
그리고 나는 앞으로의 연구에 추가로 두가지, 더하려고 하는 특성이 있다.
- Affinity
- Solubility
그래서 이것들의 워딩을 조금 예쁘게 하자면 나는 기독교인으로서 앞글자들이 구약성경의 선지자인 이사야 (ISAIAH)와 상당히 유사함을 보고 약간의 수정을 거쳐 다음과 같은 6가지 특성에 대한 Multiobjective optimization이 진행된 Nanobody generative model을 만드는 것을 2026년까지의 목표로 잡았다.
- Immunogenicity (면역원성)
- Solubility (용해도)
- Aggregation (응집성)
- Internal stability (구조안정성)
- Affinity (친화력)
- Half-life (반감기)
저자들은 기존의 canonical Ab구조 연구에서는 특정한 biophysical property가 Ab의 특정한 domain, components에 마치 배정되어있는 것 처럼 의존적이고 선형적인 연구를 진행해 왔으나, 이것은 매우 잘못된 방법이라고 이야기하고있다. 이렇게 딱딱 각 재듯 component별로 서로 independent하게 property를 조절하는 방향으로 가정하고 연구할게 아니라, modular(모듈화) 식으로 연구해야 하는데 특히 interdependency, non-linear optimization을 고려해야 한다고 이야기한다.
말은 어렵지만 그냥 기존의 통념처럼 Fc region의 서열은 Half-life에 영향을 주고, CDRH3의 서열은 Affinity에 크게 영향을 주고... 이런식으로 단순하게 independently optimization해서는 안됨을 강조하고 있는 것 같다.
이 이후에 나오는 부분들에서는 유의미한 mAb design을 위해서는 어떤 properties를 고려해야하는지를 extensively review하겠다고 엄포를 놓고있다. 이부분은 자세히 읽어서 꼭! 머리속에 숙지하자, 내 앞으로의 연구의 기초가 되어줄 부분이다.
3.2. Background: therapeutic mAbs
인간의 Immunoglobulins (Igs)에는 총 5가지의 타입이 있고, 다른건 제껴놓고 IgG말고는 therapeutic 목적으로는 사용하기 어렵다고 이야기하고 있음. 그래서 모델 만들거면 아마 IgG를 타겟으로 고려해야 할것이라고 하며, 특히 IgG에도 4가지 subtype이 존재함 IgG (1~4). 이중 1과 3은 특히 Ag에 대한 immune responses를 유발하고, 2와 4는 조금 더 미묘한 response들을 조절한다고 함. 따라서 내가 어떤 목적의 Ab, Nb를 생성하려느냐에 따라 subtype 역시 면밀하게 공부할 필요가 있다고 함.
추가로 다양한 developability screening을 통해서 manufacture proper-Ab design이라는 목적을 달성해야 하는데 각각의 특성들을 계산하기 위해 연구된 많은 ML-based model들을 정리해놓은 Table1을 참고하자. 이것은 내가 위에서 언급한 6가지의 특성들을 computationally 얻는데 큰 도움이 될 것이다.
3.3. Tailoring the plasma half-life of therapeutic mAbs
IgG가 사람의 plasma (혈장) 내에서 살아남는 반감기는 평균적으로 3주이며, 보통 6-32일간의 반감기를 가진다고 연구되어있다. 반감기 차이는 표적 매개 제거 (Target-Mediated Clearance) 뿐만 아니라 병원체 (Antigen)에 대한 직접적인 interaction을 하는 IgG 인 경우에서도 variation이 강하게 나타나므로 두 메커니즘 모두 Half-life에 영향을 주는 요인임을 기억하자.
🔹Half-life
pH를 기반으로 Ab의 Half-life를 조절하는 역할을하는 FcRn이라는 단백질이 있다. 나도 요번에 처음 알게 되었는데 상당히 중요한 개념이니 꼭 기억해놓자.
🔹FcRn (Neonatal Fc Receptor)
- FcRn은 항체 특히 IgG 및 IgG 기반 치료제(mAb)의 반감기를 연장하는 중요한 역할을 합니다.
- FcRn은 pH 의존적인 방식으로 IgG를 결합하며, 이는 항체의 안정성과 지속성을 증가시키는 핵심 기전입니다.
- FcRn의 주요 기능 : 항체의 재순환 및 반감기 연장
- 혈액 내 IgG는 세포(특히 내피세포 및 단핵구)에 의해 Endocytosis.
- 리소좀으로 이동하기 전 엔도솜(endosome) 내에서 pH 6.0 환경에서 FcRn이 IgG를 결합.
- 결합위치는 특히 IgG의 Fc elbow region에 있다고 한다.
- FcRn이 결합된 IgG는 분해되지 않고 다시 세포 표면으로 이동한 후, 중성 pH(7.4) 환경에서 방출됨.
- 이를 통해 IgG는 분해되지 않고 다시 혈류로 돌아가며, 혈중 반감기가 21~28일로 연장됨.
- FcRn과 단일클론 항체(mAb) 치료제
- 치료용 mAb의 반감기를 증가시키기 위해 FcRn 결합 친화도를 조절하는 연구가 활발히 진행됨.
- 일부 항체 치료제는 FcRn 친화성을 증가시켜 혈중 반감기를 연장하여 투여 빈도를 줄이는 전략을 사용.
- 반대로, 특정 질환(예: 자가면역 질환)에서는 FcRn 차단제를 사용하여 IgG의 반감기를 감소시키는 접근법도 있음.
🔹 FcRn과 IgG의 결합 과정 (Endocytosis 후)
- IgG의 비특이적 엔도사이토시스 (Fluid-phase Endocytosis)
- 혈류에 떠다니는 IgG는 내피세포(endothelial cells) 또는 대식세포(macrophages) 등에 의해 비특이적으로 세포 내부로 엔도사이토시스됨.
- 이 과정은 특정 수용체가 IgG를 인식해서 일어나는 것이 아니라, 단순한 fluid-phase endocytosis로 이루어짐.
- 엔도솜 내부에서 pH가 6.0으로 낮아짐
- 엔도솜(endosome)이 형성된 후, 내부로 프로톤 펌프(proton pump)를 통해 H⁺ 이온이 들어가면서 pH가 6.0으로 낮아짐.
- 이 낮아진 pH 환경에서 FcRn이 활성화됨.
- FcRn이 엔도솜 내막(endosomal membrane)에서 IgG를 포획
- FcRn은 내막(membrane)에 고정된 단백질로 존재하며, 낮은 pH에서 IgG의 Fc 영역을 강하게 결합함.
- 결합이 일어나면, IgG는 리소좀(lysosome)으로 이동하여 분해되는 것을 방지함.
- FcRn-IgG 복합체가 다시 세포막으로 이동
- FcRn이 IgG를 결합한 상태에서 엔도솜이 다시 세포막 근처로 이동함.
- 엔도솜이 세포막과 융합하면서 Exocytosis가 일어남.
- 세포 외로 방출 (IgG의 재순환)
- 세포막 근처에서는 pH가 7.4로 높아지기 때문에 FcRn과 IgG의 결합이 약해짐.
- 결과적으로 IgG가 혈류로 방출되고, FcRn은 다시 재사용됨.
🔹 정리
- FcRn이 결합한 IgG는 리소좀으로 가지 않고, 재활용 엔도솜(recycling endosome)으로 이동.
- Rab 단백질(Rab4, Rab11)과 키네신(kinesin) 모터 단백질이 작용하여 FcRn-IgG 복합체를 세포막 방향으로 이동시킴.
- 엔도솜이 세포막과 융합하면서, IgG가 방출됨 (pH 7.4에서 FcRn과 해리됨).
- FcRn은 다시 세포 내로 재활용되거나, 계속 세포막에 남아 IgG의 이동을 조절.
아무튼 이렇게 FcRn등 pH 기반의 IgG Half-life 엔지니어링 기술이 있어서 Half-life를 어떻게 optimization 할 수 있다고 하자, 이것뿐만 아니라 더 많은 pharmacokinetic profile들이 각각의 IgG에 존재하는데 특히 이것은 variable domain sequence composition에 의해 서로 다르게 나타난다. 서로다른 variable region의 서열은 서로다른 pharmacokinetic properties를 나타나도록 하는 주요한 요인이 된다. 예를들어, 친수성이냐 소수성이냐, Isoelectric point (pI), charges 등
🔹Electric Charge
예를들어보면, cell의 membrane이 negatively charge되어있는 경우가 많기 때문에 보통 positively charged 되어있는 Ab는 cell 내부로 uptake되는 endocytosis가 빠르게 진행된다. 따라서 생성되는 Ab가 positive charge를 보일 경우 더 많은 non-specific binding, 또는 활발한 endocytosis에 의해 Half-life가 줄어드는 경향성을 보인다.
반대로 pI를 감소시키거나 CDRs의 Charge distribution을 밸런스있게 조정하여 Neutrality를 띄게 하는 경우 이런 부작용을 줄여 Half-life를 조금 더 증가시킬 수 있는 효과를 볼 수 있다고 한다.
✅ Isoelectric Point
- Isoelectric Point (pI, 등전점)은 단백질이 전기적으로 중성이 되는 pH 값.
- pH < pI → 단백질이 양전하(+)를 띰.
- pH > pI → 단백질이 음전하(-)를 띰.
- FcRn과 IgG의 상호작용처럼, pH 변화를 이용해 단백질 간 결합을 조절할 수 있음.
위에서 Ab이 positive charge를 띄면 Half-life가 줄어든다고 했다, pI가 작다는말은 음전하를 띄기 쉽다는 말로 이해하면 되고 negative charge상태의 Ab는 cell membrane과 쉽게 결합하지 않는다. (따라서 Half-life 증가 및 비특이적 결합 감소)
Variable domain의 charge feature 역시 receptor와의 engagement를 조절(modulate)하여 Half-life를 조절한다는 최근 연구가 상당히 많이 밝혀지고 있다.
최근 연구 기반으로 Half-life에 가장 큰 영향을 미치는 PK특성으로 다음 4가지 특성이 지목되었다고 한다.
- FcRn affinity
- Thermal stability
- pI
- Binding poly-specificity reagent (PSR)
🔹 Binding Poly-Specificity Reagent (PSR)란?
Binding Poly-Specificity Reagent (PSR)는 단클론 항체(mAb) 또는 다른 단백질이 다양한(비특이적인) 결합을 얼마나 많이 하는지를 측정하는 데 사용되는 분석법입니다.
즉, 항체의 "비특이적 결합(poly-specificity)"을 평가하는 데 사용되는 시약(reagent)입니다.
🔹 왜 PSR이 중요한가?
항체 치료제(mAb)는 높은 특이성(specificity)과 낮은 비특이적 결합(low poly-specificity)을 가져야 합니다.
하지만 일부 항체는 비특이적으로 다양한 항원이나 세포 단백질들과 결합(poly-specific binding)할 수 있으며, 이는 다음과 같은 문제를 일으킬 수 있습니다:
- 약물 독성 증가 (Increased Off-Target Effects)
- 특정 항원을 타겟팅해야 하는 mAb가 원하지 않는 단백질들과 결합하면 예기치 않은 면역 반응 또는 부작용을 유발할 수 있음.
- 혈중 반감기 감소 (Reduced Half-life)
- 비특이적 결합이 많으면 신장, 간에서의 제거(clearance)가 빨라짐 → mAb의 체내 지속 시간이 짧아짐.
- 생산 공정 문제 (Manufacturing Issues)
- 항체가 세포 배양 시 불필요한 단백질들과 결합하여 응집(aggregation)하면 생산 수율이 낮아지고, 안정성이 감소할 수 있음.
✅ PSR 분석을 통해 mAb의 비특이적 결합을 정량화하여, 개발 초기 단계에서 문제를 식별하고 최적화할 수 있음.
PSR값이 높다 == 비특이적 결합이 많다 == non-specific binding mediated clearance로 half-life 감소 가능성 높다.
3.4. Improving the stability of mAbs
다양한 stability 관련 속성들이 존재한다. thermodynamic or conformational stability (thermal stability) 또는 colloidal stability (solubility, viscosity, aggregation 등) 이러한 stability들은 나중에 manufacturing할때 중요한 요소가 된다. 차갑게 냉동한 상태에서도 conformational change가 없어야 되는 등 안정성이 있어야 약물로써 역할을 할 수 있기 때문이다.
근데 다양한 Ab에 대해서 각각의 stability를 직접 실험에 의해 결정하기는 참 어렵다. 이런 문제를 해결하기 위해 high-throughput computational method로 계산을 통해 stability feature들을 계산하거나 학습하는 ML-based 방법들이 많이 연구되고 있다. 역시 Table1에 정리되어있다.
Fab arms에 대한 sequence optimization을 통해서 storage stability를 증가시킬 수 있다는 연구가 있단다. (https://doi.org/10.1021/mp400666b)
컴퓨터 분야에서는 특히 Molecular Dynamics (MD)를 고려하여서 solvent conditions, spatial aggregation propensity(SAP), fraction of native contacts (Q-value)등을 계산하고 평가하는 연구들이 주가된다.
Thermostabiltiy
계산적 방법을 통해서 thermostabiltiy 예측하는 연구 Improving antibody thermostability based on statistical analysis of sequence and structural consensus data (https://doi.org/10.1093/abt/tbac017)
아직까지는 simulation 분야가 thermal stability 예측에서는 더 좋은 정확도를 가지고 있는 것으로 평가되고 있나보다
Aggregation
aggregation은 antibody들이 서로 뭉쳐서 large cluster를 이루는 현상을 말하는데 매우 좋지 못한 특성임은 자명하다. Aggregation을 예측하기 위해서 보통 aggregation-pron region (APR) 을 예측하는 ML 모델을 사용한다고 한다. APR에 대한 연구를 진행한 다양한 연구들이 있단다 (https://doi.org/10.1038/s41598-021-93019-9, https://doi.org/10.1007/s11095-010-0143-5, https://doi.org/10.1002/prot.23085, https://doi.org/10.4161/mabs.1.3.8035)
근데 최근 연구에 따르면 위에 언급된 모델들 성능이 매우 poor하단다. Aggregation prediction model은 그렇다면 어떤것을 참고해야하는가? 일단 poor하다고 얘기한 근거가 되는 논문을 나중에 읽어볼 필요가 있겠다. (https://doi.org/10.1007/s12551-021-00778-w, https://doi.org/10.1080/13506129.2020.1715363)
Antibody의 구조와 AA 서열의 charge information을 기반으로 Aggregation propensity(성향)을 예측하는 연구로 Developability Index (DI)를 제안한 연구 (https://doi.org/10.1016/j.bbapap.2021.140682)
최소 임상 2차까지 진입했던 137개의 mAb를 12개의 assey를 기반으로 연구하여 유리하거나 불리한 특성을 파악하여developability parameters를 정리 및 연구한 논문(https://doi.org/10.1073/pnas.1616408114)에서는 단백질 구조의 안정성이 낮거나 aggregation되기 쉬운 항체 그리고 polyreactivity (특이성이 낮은 항체)를 보이는 특성의 항체들은 성공률이 떨어지는 것으로 조사되었다.
화합물의 약물 조건인 리핀스키의 다섯가지 룰을 antibody에도 적용하기 위해 약물로써 사용가능하기 위한 항체의 가장 중요한 5가지 특성을 파악하기 위해 연구한 그룹(https://doi.org/10.1073/pnas.1810576116)에서는 242개의 최소 임상 1차 이상 진행된 IgG1 subclass의 mAb를 연구하였다. 이들은 computational method로 Therapeutic Antibody Profiler (TAP)라는 tool을 개발하여 온라인으로 배포하였는데 5가지의 특성을 고려하여 항체로서 좋은 특성을 갖는지를 계산하는 컴퓨팅 방법을 제시하였다. (자세한건 https://opig.stats.ox.ac.uk/webapps/sabdab-sabpred/sabpred/tap 참고)
Rawat et al은 ML-based 연구를 통해서 Light chain에 따른 aggregation prone을 연구하였는데 특히 lambda light chain들이 존재하는 mAb의 경우 aggregation되기 쉽다는 결론을 내렸다. 반대로 kappa light chain을 가지고 있는 mAb들이 더 좋은 특성을 보이는 것으로 연구하였다.
Vad der Kant 팀은 aggregation propensity와 thermodynamic stability를 동시에 예측하는 연구를 진행함 (https://doi.org/10.1016/j.jmb.2017.03.014)
aggrescan3D (https://biocomp.chem.uw.edu.pl/A3D2/) 등의 웹 기반 서비스도 있다.
결과적으로 이렇게 다양한 Protein Aggregation prediction methods들이 최근 몇십년간 꾸준히 mature되고 있단다.
Solubility
solubility는 colloidal stability의 관점에서 aggregation과는 반비례한다. (aggregation이 잘 되면 stability가 낮은것) SOLpro는 가장 처음으로 solubility를 예측하는 모델이었단다. 지금 사용하기엔 너무 옛날 모델인 것 같다. Protein-Sol 모델 역시 다양한 feature들을 이용해서 linear-model을 이용해 prediction한다. 이것도 마찬가지로 linear model이라는 걸 보니까 단순 regression 모델같다. 현재 사용하기엔 무리가 있어보인다. CamSol도 있단다. Citation을 보니 약 500회로 괜찮은 method같긴 하지만 2015년도 논문으로 10년전 방법이다. 최근의 연구에 도움을 받기는 어려워보인다.
다양한 데이터 증가로 인해 최근에는 DeepLearning based의 모델이 개발되었고, CNN기반의 DeepSol (2018, oxford Bioinformatics)등의 모델이 탄생했다.
다행히도 solubility의 경우 다른 parameters보다 더 많은 데이터가 확보되어 조금 더 robust한 모델을 구축하고 학습할 수 있다는 장점은 있지만 Antibody specific한 데이터는 많지 않아 Antibody solubility 예측에 있어서는 여전히 어려움을 겪고 있다고 한다.
논문에 나온 가장 최신의 모델이 2018년도인걸로 보아서 solubility를 예측하는 모델은 내가 추가로 더 찾아봐야 할 것 같다.
Viscosity (점도)
Viscosity는 약물로 만들 때 dose등을 결정하고 cost를 낮출 수 있는 중요한 요소이긴 한데, 원체 데이터가 적어 학습시키기가 어렵단다. 그리고 대부분 intermolecular activity때문에 결정되기 때문에 (반데르발스 힘, 전기적 척력 등) 아직까지도 그냥 high-computational cost method인 Molecular Dynamics simulation에 의해서 연구하는 경우가 많다고 한다.
다른 모델들은 크게 소개되지 않지만 An interesting study라는 말로 저자들이 집중한 논문이 하나 있어서 이것만 링크를 걸어둔다. 나중에 viscosity를 고려하게 된다면 이 논문은 읽어보자 (https://doi.org/10.1126/sciadv.abb0372)
3.5. Reducing the immunogenicity of therapeutic antibodies
Anti-Drug Antibodies (ADAs)는 단백질 기반 치료제의 면역원성(immunogenicity)으로 인해 발생하며, 치료 효능을 감소시키고 부작용을 유발할 수 있어, 단일클론 항체(mAb) 개발 시 해결해야 할 중요한 문제란다.
예를들어 내가 힘겹게 mAb형태의 단백질 기반 치료제를 개발했다고 하자, 이걸 사람에게 injection 한 순간 이것을 항원으로 인지하여 우리 몸에서 면역반응이 일어난다면 우리가 애써 만든 항체 치료제를 우리 몸은 항원으로 인식하여 공격하고 중화시키거나 clearance를 시켜버릴 수 있다. 그럼 모든 노력이 수포로 돌아간다. Clinical Trial을 통과하기는 커녕 치료제로써 가치 자체가 현저히 떨어진다.
실제로 TNF-alpha를 Target으로 하는 약물인 adalimumab은 약 35%의 환자들에게서 ADA가 발생하였고 12개월 이내로 약물의 효과가 급격하게 저하되는 결과로 나타났다고 한다. (어떻게 Clinical Trial을 통과했는지는 모르겠다)
따라서, Immunogenicity는 mAb 기반의 치료제 개발에 있어서 상당히 중요한 역할을 하는 feature로 반드시 고려되어야 한다.
mAb가 antigen으로 인지되는 순간, adaptive immune cascade 반응이 시작되어 다양한 MHC II, T-helper cell, Antigen-Presenting Cells (APCs) 등 다양한 cell들의 유기적인 immune response에 의해서 mAb 역시 digestion되고 clearance 되는데 이러면 당연하게도 mAb는 치료제로써 역할을 할 수 없어진다. (immune response의 정확한 기작들이 전혀 기억나지 않는구나, 면역학도 다시 공부를 해야할 필요성을 느낌)
맨 처음으로 approved 되었던 mAb 기반 치료제는 mouse의 IgG2 subtype을 이용한 Antibody였다고 한다. (https://doi.org/10.2165/00003495-198937060-00004) 그러나, mouse based mAb는 immunogenicity가 강했고, 연구들을 거치면서 다음과 같은 3가지의 점점 human의 antibody sequence와 유사한 humanized된 mAb 개발로 전환되었다.
- chimeric versions where the constant regions of the mAb are of human origin
- humanized antibodies where only the CDRs are of murine origin, and finally
- fully human mAbs where murine sequences are completely absent from the mAb sequence as it is obtained from human cell libraries.
특히 humanization은 최근에는 in vivo 실험에서의 tolerability (내성) 때문에라도 상당히 많은 연구에서 기본적으로 고려하며, 적용되고 있다. 21년 기준으로 현재까지 approved 된 mAb 기반 치료제의 50%는 humanized되어있는 sequence를 가지고 있다.
보통 mouse 기반의 실험을 많이 하기 때문에 murine(설치류) 기반의 mAb에서 개발이 시작되어, human 기반의 mAb 서열과 유사한 형태로 고쳐가는데 이런 과정을 humanization 한다고 하며 이 과정에서도 target specificity, affinity, stability는 유지함을 목표로 한다. 보통 murine mAb의 CDR 서열만을 가져와서 human의 FRs (Framework Regions) 에 끼워넣는 방식으로 연구가 되며 그 중에서도 그나마 murine의 FRs와 상당히 homologous를 띄는 FRs을 선별해서 humanization을 한다는 것 같다. 이렇게 murine기반으로 얻어진 CDR을 humanized FRs에 치환하는 과정을 grafting이라고 한다.
Canonical bio lab에서는 이런 과정을 전부 trial- and - error 방식으로 그냥 시간과 돈, 노력, human power등을 쏟아 부어서 원하는 성질을 그대로 만족하면서 humanization까지 완료된 mAb 단백질을 얻을때까지 반복하여 실험하는 수밖에 없었는데, 최근에는 computational한 방법으로 Amino Acid (AA) 서열의 치환을 simulation 하는 tool들이 많이 개발되었단다.Position-Specific Scoring Matrices (PSSMs)를 이용한 최근의 연구가 있으니 참고해보란다. (https://doi.org/10.3389/fimmu.2021.728694)
Gao et al은 얼마나 내 mAb 단백질이 human-like한지를 파악하기 위한 'humanness' 개념을 scoring을 통해 양적으로 계산할 수 있는 연구를 진행하였다. (https://doi.org/10.1186/1472-6750-13-55) (Citation은 100회정도, 2013년도 논문이라 지금와서 직접 사용하기엔 어려움이 있을 듯 하다.)
Table 1에 다양한 mAb humanization을 위한 tool 개발 연구들이 정리되어있으니 참고하란다.
Hu-mAb, 많은 human 및 mouse IgG sequence를 학습시켜 input하는 서열이 얼마나 human IgG에 가까운지를 계산하고 FRs의 몇몇 AA 치환을 통해서 더 좋은 human-like mAb가 될 수 있다는 추천까지 진행한단다. (2021, oxford Bioinformatics, 21년도 publish된 논문인데 citation 100회정도에 저널도 좋다 이건 참고해볼 법 하다.) 심지어 이 연구에서 high score를 받은 mAb들은 immunogenicity역시 낮은 경향성을 보였다고 한다.
가장 최근으로 나온 연구로 Prihoda et al은 BioPhi라는 모델을 개발했다. 저자들이 정리해놓은 바로는 3개정도의 sub tool들로 나뉘어 있다고 하고, Hu-mAb보다 더 좋은 성능의 human-like mAb 예측 성능을 보였다고 한다. (https://doi.org/10.1080/19420862.2021.2020203) (mAbs IF 5.0~7.0, 2022년도 모델인데 citation 133회정도, 이것도 참고할 수 있어보인다.) 특히 BioPhi는 Hu-mAb과 달리 Deep Learning based 연구라니까 더욱 참고해볼 가치가 있어보인다.
별나게도, 그럼 이런 의문이 들지 않느냐는 것이다. 왜 굳이 humanization하느냐? 그냥 human에서 Ab를 생성하면 되는거 아니냐? 그러면 immunogenicity 문제는 해결할 수 있지 않느냐?
근데 그렇지도 않단다. human에서 만들어진 mAb 도 이상하게 immunogenicity를 100% 회피할 수는 없단다. 그래서 어떤방법, 어떤 origin 기반으로 만들어진 mAb이던지 반드시 immunogenicity에 대한 평가와 검증은 필요하다고 한다.
Immunopeptidome이라는 개념을 이용해 immunogenicity를 평가하는 방법도 있다. 다음은 논문 내용 기반으로 ChatGPT를 이용해서 요약한 내용인데 꼭 읽어보길 바란다.
- Immunopeptidome이란?
- Immunopeptidome은 MHC class II 분자가 T-helper 세포에게 제시하는 펩타이드(peptides)의 전체 집합을 의미합니다.
- 이 펩타이드는 세포 내에서 분해된 단백질 조각으로, 면역 반응을 유도할 수 있는 항원성 정보를 제공합니다.
- 단일클론 항체(mAb) 개발에서는 이 항체가 MHC class II에 의해 제시될 가능성이 있는 펩타이드로 분해되는지를 분석함으로써 면역원성(immunogenicity)을 예측할 수 있습니다.
- Immunopeptidome 분석의 중요성
- 단일클론 항체가 분해되어 MHC class II에 의해 제시되는 펩타이드가 특정 T-helper 세포를 활성화하면, 면역 반응이 유도되고 ADA(anti-drug antibodies)가 생성될 가능성이 높아집니다.
- Immunopeptidome 분석을 통해 mAb의 분해 산물이 면역 반응을 유발할 가능성을 사전에 예측할 수 있습니다.
- 이를 통해 항체의 면역원성을 줄이고 안정성을 높이는 방향으로 설계할 수 있습니다.
- HLA의 복잡성과 면역원성 평가의 한계
- HLA(Human Leukocyte Antigen)는 MHC class II 분자를 암호화하는 인간 유전자군으로, 구조적으로 매우 다양합니다.
- 현재까지 8000개 이상의 HLA class II 대립 유전자(allelic forms)가 발견되었으며, 각 개인은 최대 8개의 HLA class II 대립 유전자를 발현합니다.
- 이 다양성은 mAb 개발에서 면역원성을 예측하고 평가하는 작업을 어렵게 만드는 주요 요인입니다.
예를 들어, 한 개인에서 면역 반응이 없더라도, 다른 개인에서 강력한 면역 반응이 나타날 수 있습니다.
Immunopeptidome학습을 위한 데이터베이스가 있단다. (https://www.iedb.org/) 참고하자. 이 데이터를 이용하면 input된 protein 또는 peptide가 T-Cell을 활성시키는 정도를 예측하는데 도움이 된다고 한다. 몇몇 한계 때문에 immunogenicity prediction 모델들은 아직까지 서열기반의 예측 모델인 경우가 많다고 한다. 그 중 netMHCIIpan이라는 모델을 자세히 소개하고 있으니 한번 찾아볼 가치가 있어보인다 (https://doi.org/10.1021/acs.jproteome.9b00874, https://doi.org/10.1074/mcp.TIR119.001658) 가장 최근 버전인 4.0은 EL기반의 많은 실험 데이터를 기반으로 업데이트가 되어서 T-cell epitope prediction method 중에 SOTA를 달성하고 있으니 참고하란다. (다만 2022년 기준)
다만, 이 모델도 8000개나 되는 모든 HLA class II를 하나하나 대응할 수는 없고, 인간의 98%정도에서 발현되는 아주 common한 HLA class II 유전자 기반의 MHC II인 25개의 HLA class II만을 cover한다고 한다. (그래도 98%정도면 아주 훌륭한 수준 아닌가)
3.6. Designing antibodies with desirable efficacy and developability remains challenging
여전히 어려움이 많단다. 특히 immunogenicity를 computationally prediction하는 방법들은 아직까지 그렇게 좋은 accuracy를 보이지 못하며, 예측한다고 한들 어차피 in vitro는 반드시 해봐야 안정성을 실제로 신뢰도 있게 평가할 수 있기 때문에 computational prediction task가 시간이나 비용적으로 낭비가 될 수도 있다는 단점이 있다고 한다. 게다가 완전한 human origin의 mAb들도 immunogenicity를 보이는 마당에 과연 in silico 연구된 prediction score가 얼마나 설득력 있게 연구자들에게 와닿을지도 반드시 생각해 보아야 하겠다. (물론 in silico연구가 도움이 안된다는건 아니지만... 갈길이 멀단다) 그리고 대부분의 언급된 연구들이 protein을 기반으로 하지, mAb에 집중한 연구들은 아니기 때문에 과연 단백질의 서브타입이기는 하다만 보통의 단백질들과 구조적으로, 기능적으로 상당한 차이를 보이는 mAb에도 그런 예측 모델들이 얼마나 잘 맞아떨어지는지는 생각해봐야 할 문제란다.
게다가 지금까지 언급된 대부분의 prediction tool들은 mono-parameter prediction tool로써 다양한 multi-paramtere optimzation (또는 prediction) tool이 아니기 때문에 한계점이 있단다. 각각의 prediction tool을 모두 따로 적용해야 하므로 computational cost가 심각해지는 등의 문제가 있을 수 있단다. 게다가 몇몇 연구들은 코드 등을 therapeutical business등의 이유로 공개하지 않은 논문들도 있어서 further한 수준의 연구가 불가능한 모델들도 있단다.
그 외 여러 문제점들은 그냥 ChatGPT를 이용해서 요약해놓겠다.
- 단일 매개변수(mono-parameter) 접근법
- 대부분의 최신 in silico 도구는 단일 매개변수(single parameter)를 다루는 도구로 설계되어 있습니다.
- 여러 필요한 매개변수를 한 번에 처리할 수 있는 다중 매개변수(multi-parameter) 파이프라인이 부족합니다.
- 도구의 접근성 부족
- 제약 회사들이 개발한 몇몇 계산 도구는 공개적으로 이용할 수 없어, 널리 적용하거나 평가하는 데 어려움이 있습니다.
- 개발 가능성 매개변수에 대한 종합적 지도 부족
- 항체 설계에서 다양한 개발 가능성(developability) 매개변수를 각 항체 부위에 매핑한 **종합적인 지도(atlas)**가 부족합니다.
- 이는 계산 기반 항체 설계를 더 어렵게 만듭니다.
- 개발 가능성 매개변수 간의 균형 어려움
- 하나의 항체에 대해 모든 개발 가능성 매개변수를 균형 있게 최적화하는 것은 도전 과제입니다.
- 예를 들어, 안정성(stability)을 개선하면 응집(aggregation)이 증가할 수 있는 트레이드오프가 발생할 수 있습니다.
- 개발 가능성 최적화된 라이브러리 부족
- 사전 스크리닝 단계에서 개발 가능성을 최적화한 **라이브러리(libraries)**를 구축하는 방법이 부족합니다.
- 머신러닝 모델 활용의 부족
- 여러 실험 캠페인에서 얻어진 데이터를 결합하여 머신러닝(ML) 모델을 활용한 다중 매개변수 최적화가 아직 제한적입니다.
- Total
- Today
- Yesterday
- 백준
- 기계학습
- MatrixAlgebra
- marginal likelihood
- ai신약개발
- kl divergence
- ai인공지능
- eigenvector
- Matrix algebra
- 오일석기계학습
- Manimlibrary
- kld
- manim
- manimtutorial
- manim library
- elementry matrix
- 베이즈정리
- 인공지능
- MLE
- variational autoencoder
- eigenvalue
- 이왜안
- vae
- 선형대수
- MorganCircularfingerprint
- 3b1b
- 제한볼츠만머신
- 최대우도추정
- 3B1B따라잡기
- 파이썬
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |