摘要
本发明公开了一种基于角色驱动的医疗文本数据合成方法,涉及文本数据合成和人工智能技术领域,包括以下步骤:S100、原始问题生成;S200、原始问题筛选;S300、医疗文本数据合成。本发明角色描述和兴趣内容生成,增强了对不同医疗角色需求的适应性,利用文本编码模型和向量数据库,实现语义去重和相关性评估,去除语义重复的内容,利用大语言模型精确评估相关性,提高数据质量和多样性,通过变体问题和答案生成,丰富了医疗文本数据的多样性和实用性。本发明提高了医疗文本数据的个性化与针对性,增强了医疗文本数据的质量与去重效率,丰富了问题类型,优化了生成内容,全面覆盖了医疗文本数据的各种信息需求。
技术关键词
医疗文本数据
大语言模型
兴趣
生成提示词
编码
内容分类
语义
排序模型
关注点
切片
职业
人工智能技术
答案
解析器
字符
系统为您推荐了相关专利信息
数据检索方法
文本
图像特征提取
计算机可读指令
数据推送方式
超低空无人机
深度强化学习模型
规避方法
网络
编码器
DDR3SDRAM控制器
视频传输
芯片工作模式
硬件描述语言
介质无关接口