摘要
本发明涉及一种多模态数据驱动的社会工作领域建模优化方法,属于数据处理领域,优化方法包括:构建社会工作多模态数据,并进行数据预处理后将文本转换为嵌入向量;采用流行度偏差正则化处理器通处理社会工作领域的数据输入;动态选择降维维度,并采用UMAP算法将BERT嵌入空间中的向量降维;将文档聚类到相似的嵌入组中,通过计算数据点之间的密度关系形成层次化的聚类结构,并通过密度阈值划分最终的簇;计算每个词在主题集群中的词频和该词在整个语料库中的逆文档频率,并计算语义相似度来重新分配离群点。本发明优化BERTopic模型的多模态兼容性,支持从不同数据来源提取并融合主题信息,增强社会议题的分析深度。
技术关键词
多模态
轮廓系数
相关性搜索方法
离群点
数据
融合主题信息
文本
优化器
社会学
矩阵
主题关键词
动态
密度
术语
语义
频率
集群
生成树
系统为您推荐了相关专利信息
爆破参数优化方法
岩体力学参数
水带
参数优化模型
三维激光扫描仪
数据诊断方法
电气设备
单线
XML解析方法
关系
管理云平台
智能决策支持系统
项目管理模块
现场数据采集
监控模块
多模态数据库
数据库构建方法
元素
计算机可执行指令
文本