如何构建AI智能导诊助手？使用BERT模型精准推荐医院科室

am928 发表于 2025-3-19 22:23:53

[[]]

你是否为医院的科室选择而感到烦恼呢？这篇文章会引领你去构建一个 AI 智能导诊助手。只要输入症状的描述，它就能精准地推荐相应的科室。并且，代码具备完全开箱即可使用的特点，你能够轻松地运行并进行体验，让你的导诊助手在你的设备上呈现出“活”的状态。

我们会运用 BERT 模型去识别以及理解用户的自然语言输入，同时依据症状来进行科室推荐。现在让我们一起去探寻这个技术魔法背后的奥秘吧！

效果演示

在我们深入代码之前，先看下成品效果(后端简单效果)吧：

用户输入症状描述，智能助手会快速返回推荐的科室：

<pre> <code class="prism language-plaintext">用户输入：头痛、发烧、咳嗽
系统推荐：内科
用户输入：腹痛、反酸
系统推荐：消化内科
</code></pre>
很酷吧？你只要输入简短的症状描述，系统就能够高效且准确地推荐合适的科室！随后，我们会一步步带你构建这个系统。

系统架构与实现思路

整个系统分为四个模块：

我们要准备一份标注数据，这份数据是症状与科室相对应的。利用 BERT 模型的语义理解能力，把症状描述进行分类，使其归入合适的科室。使用构建 API，让前端能够调用模型服务。将系统打包成镜像，以便于进行部署和分享。第一步就是准备数据。

我们先准备一个症状到科室的标注数据集。例如：

症状描述科室

胃痛、反酸、腹胀

消化内科

头晕、心悸、胸闷

心内科

发烧、咳嗽、喉咙痛

内科

皮疹、瘙痒、红肿

皮肤科

这些数据将成为我们训练 BERT 模型的根基。我们会利用这些数据，让模型能够理解不同症状所对应的科室。

将这些数据保存为 .csv 文件。

️ 第二步：微调BERT模型

我们会借助 BERT 所具备的强大能力去理解症状描述。你不必进行模型的从头开始训练，仅仅需要对其进行微调就可以了。以下是简略的代码：

<pre> <code class="prism language-python">import pandas as pd
from transformers import BertTokenizer, BertForSequenceClassification, Trainer, TrainingArguments
import torch
from sklearn.preprocessing import LabelEncoder
# 加载数据
data = pd.read_csv('hospital_data.csv')
X = data['症状描述']
y = data['科室']
# 标签编码
label_encoder = LabelEncoder()
y_encoded = label_encoder.fit_transform(y)
# BERT分词器
tokenizer = BertTokenizer.from_pretrained('bert-base-chinese')
# 分词
https://img0.baidu.com/it/u=81352404,1730903007&fm=253&fmt=JPEG&app=138&f=PNG?w=798&h=500

def tokenize_texts(texts, max_len=128):
return tokenizer(
 texts.tolist(),
 max_length=max_len,
 padding=True,
 truncation=True,
 return_tensors="pt"
)
tokens = tokenize_texts(X)
# BERT模型
model = BertForSequenceClassification.from_pretrained("bert-base-chinese", num_labels=len(label_encoder.classes_))
# 训练设置
training_args = TrainingArguments(
output_dir='./results',
num_train_epochs=3,
per_device_train_batch_size=8,
evaluation_strategy="epoch"
)
# Trainer API
train_dataset = torch.utils.data.TensorDataset(tokens['input_ids'], tokens['attention_mask'], torch.tensor(y_encoded))
trainer = Trainer(model=model, args=training_args, train_dataset=train_dataset)
# 模型训练
trainer.train()
</code></pre>
以上代码会在你的数据集上训练一个模型，这个模型是 BERT 模型。利用 BERT 模型强大的语义理解能力，能够完成从症状到科室的分类。

第三步：构建高效API

有了模型之后，我们利用它来构建一个 API 接口，如此一来，你便能在各类应用中对这个导诊助手进行调用了。

<pre> <code class="prism language-python">from fastapi import FastAPI, Request
from transformers import BertTokenizer, BertForSequenceClassification
import torch
import joblib
app = FastAPI()
# 加载模型和标签编码器
model = BertForSequenceClassification.from_pretrained('./results')
tokenizer = BertTokenizer.from_pretrained('bert-base-chinese')
label_encoder = joblib.load('label_encoder' 对应的文件名为 joblib)
@app.post("/predict")
async def predict(request: Request):
json_data = await request.json()
symptoms = json_data['symptoms']
tokens = tokenizer(symptoms, max_length=128, padding=True, truncation=True, return_tensors="pt")
with torch.no_grad():
 outputs = model(tokens['input_ids'], attention_mask=tokens['attention_mask'])
 prediction = torch.argmax(outputs.logits, dim=1).item()
department = label_encoder.inverse_transform([prediction])[0]
return {"department": department}
</code></pre>
快速启动

将代码保存为 app.py。使用以下命令运行：

<pre> <code class="prism language-bash">使用 uvicorn 运行 app 中的 app ，并且开启重载功能，同时设置主机地址为0.0.0.0 --port 8000
</code></pre>
现在，你可以通过POST请求来调用API：

<pre> <code class="prism language-bash">curl -X 'POST' \
该链接为 http://localhost:8000/predict 。它指向一个特定的地址，用于进行某种预测相关的操作。在这个地址上，可能会有相应的程序或系统来处理和返回预测结果。 \
-H 接受：应用程序/JSON 格式。 \
-H Content-Type 的类型为 application/json 。它表明所传输的内容是 JSON 格式的数据。这种类型常用于 Web 服务和 API 中，以方便数据的传输和解析。当服务器接收到带有 'Content-Type: application/json' 的请求时，它会知道如何处理和解析该请求中的 JSON 数据。同样，当客户端发送带有该类型的请求时，服务器也能准确地理解和处理请求的内容。 \
-d 症状包括头痛，还有发烧，同时伴有咳嗽。
</code></pre>
系统将返回类似如下的结果：

<pre> <code class="prism language-json">{
"department": "内科"
}
</code></pre>
第四步：化部署

通过容器化，系统变得更加便于共享和部署。它在不同的环境中都能够无缝运行，只需几行命令就可以部署上线。

<pre> <code class="prism language-dockerfile">FROM python:3.9
WORKDIR /app
COPY . .
运行 pip 命令来安装 requirements.txt 文件中的依赖项。
EXPOSE 8000
CMD 包含 "uvicorn" 以及 "app:app" ，同时还包含 "--host" 、"0.0.0.0" ，另外还有 "--port" 和 "8000" 。
</code></pre>
创建.txt

<pre> <code>fastapi
torch
transformers
joblib
uvicorn
</code></pre>
构建和运行镜像

<pre> <code class="prism language-bash">使用 docker 进行构建操作，将其标记为 hospital-assistant 。.
docker run -d -p 8000:8000 hospital-assistant
</code></pre>
项目体验

你的智能导诊助手现在已经能够在任何地方运行啦！本地测试可以运行，云端部署也能运行。要是把这个智能导诊系统嵌入到你的应用里，用户只要输入症状描述，就能够获得推荐科室，这样能极大地改善他们的医疗体验呢！

是不是很激动？亲自试试吧，享受AI为生活带来的便捷！

页: [1]

【宏智网络】's Archiver

如何构建AI智能导诊助手？使用BERT模型精准推荐医院科室