內容目錄
Toggle

下列醫藥資訊原報導出處為 theBodyPro: How Much Does AI Know About HIV Prevention and Testing?
本文章經愛知識 iKnowledge依編輯所在地醫療現況及閱讀習慣進行編輯及改寫
美國加州 HIV/AIDS 政策研究中心的 Marisa Fujimoto 研究團隊希望透過一系列與愛滋相關的問題,來釐清四個近期被廣泛運用的 AI 系統會給予怎樣的醫療建議。該團隊設定發問的問題包括:HIV 的傳播途徑及篩檢地點等基礎問題,到如果在使用 PrEP (暴露前預防性投藥)忘記服藥等進階的狀況題。

關於這個研究
該研究針對 ChatGPT-4o、Claude 3.5 Sonnet、Gemini 1.5 Flash和Llama 3.1 這四個 AI 系統,在回覆訊息時的「準確度」、「全面性」、「語氣友善度」及「清晰度」這四個面向進行評估。
Gemini 是 Google 開發的,Llama 則是 Facebook 母公司 Meta 的產品。由於 AI 系統的更新頻率及速度都極為快速,在 2024 年 7 月該研究進行評估之後,Gemini 和 Llama 皆已發布更新版本,因此實際的應用狀況可能會比該研究的研究結果更好。

研究結果
研究團隊發現,四種 AI 系統都可以提供基礎但經過簡化的 HIV 預防衛教知識,語氣上是精準且中立的。
例如:當問題是「我應該在危險性行為後多久內進行 HIV 篩檢?」,一些 AI 系統的回覆中會省略關於「空窗期」的資訊。除此之外,四個系統都無法延伸到詢問者的動機,進而提供「HIV暴露後預防投藥(PEP)」及「緊急避孕措施」相關的訊息。
當詢問「在奧克蘭,可以在什麼地方進行 HIV 篩檢並取得愛滋預防藥物?」時,AI 系統的回答通常都不完整。除了 ChatGPT 會列出五個醫療單位選項,同時提供取得愛滋預防藥物的相關規範,並透過使用者定位提供轉介連接之外,其他的系統只停留在推薦醫療院所,不會提供後續延伸的資訊及轉介連結服務。
四個系統對大多數問題都會給予類似的回覆內容。但當他們被問到類似「如果我的另一半是 HIV 感染者,並且已經接受治療。那我該跟他做愛嗎?」這類大眾意見呈現分歧的問題時,ChatGPT 和 Claude 除了給予回覆外,同時說明了「U=U」(測不到 = 不會傳染)的概念。但 Gemini 和 Llama 則提供了相對保守、謹慎的規定及建議。例如:Llama 在回覆時就提到「HIV 的治療大大降低了傳播的風險,但並無法視為沒有風險。」
這樣可能顯示當下公開可搜尋到的 U=U 資訊可能存在不同的觀點及差異。一般來說,AI 系統不會每次都搜尋網路即時的資訊,會依靠系統建立、訓練時給予的資料(數據)做為回覆的依據。但如果這些資訊並未與時俱進、沒有更新,那就可能會在回覆時提供過時的答案及訊息。
此外,研究團隊也想知道 AI 系統,會不會因為使用者的背景不同,而提供「客制化、專屬該群體」的資訊?
舉例來說,當 ChatGPT 「使用 PrEP 會危害我的健康嗎?」。系統給予了相當仔細的回應並在結尾時提到「PrEP 適合健康良好的人使用」。當研究人員接著回「我不明白」,系統會給予簡化、全面,但結論相同的資訊。
但是如果問題換成:「我是一個跨性別女性,使用 PrEP 會危害我的健康嗎?」系統就無法給出對應、客制化的回覆了(一般而言,會需要說明 PrEP 是否可以跟賀爾蒙療法併用)。同樣的,如果問題是「我是一個跨性別女性,我該去哪裡做 HIV 篩檢?」系統也無法提供跨性別友善的篩檢地點建議清單。
整體來說,ChatGPT-4o 在「準確度」、「全面性」及「清晰度」三方面比另外三個系統表現更好。四個系統的「語氣友善度」都相當不錯。另一方面 Llama 3.1 在該研究中獲得最低的分數。

總結
「根據我們的研究結果,我們對於 AI 應用在 HIV 預防衛教的可行性,保持謹慎但樂觀的態度… AI 系統可以提供相當精確且容易取得的 HIV 相關知識… 但我們同時認為確保 AI 系統可以提供愛滋風險群體客制化的資訊相當重要… 」研究作者在總結時提到。
參考資料:
Marisa Fujimoto, Evaluating AI chatbots for HIV prevention: An assessment of response quality and user tailoring, California HIV/AIDS Policy Research Centers, October 2024
https://chprc.org/wp-content/uploads/2022/06/AI_Policy_Brief_Oct2024.pdf