【摘要】普适个性化内容推荐是大数据时代的一种新的服务形式,也是近年来学术界和业界关注的热点问题。本文针对国内外现有研究缺乏学习机制和集成多种内容推荐业务的支持性系统的解决方案的问题,在前期研究的基础上,结合语义网服务技术,提出基于螺旋模型的服务系统工作模式,使各种服务有效运转,共同实现整体目标,以支持各种内容推荐业务方便而灵活的构建。
【关键词】普适个性化推荐 上下文感知 螺旋模型 语义网服务
一、引言
以普适计算为核心的信息环境带来了许多新的生产模式和生活理念,成为未来不容忽视的巨大经济驱动力,不少国家都将普适信息环境的建设作为新一轮国家信息产业战略的主导[1]。普适个性化内容推荐是指根据用户偏好、行为习惯和时空环境等因素,将相关内容通过各种网络和终端主动推送给用户的一种动态的个性化服务模式。该领域的研究将个性化服务、上下文感知计算和语义Web服务等领域的方法和技术相结合,致力于在一种开放、动态和集成的环境下,给用户提供随时随地的,更具针对性、多样化和智能化的服务[2][3]。这些问题的研究对于支持内容服务模式的创新和内容服务行业的发展具有很大的理论意义和商业价值。
目前,该领域的研究仍处于探索和试验阶段,成熟的规模化应用并不多见,主要问题在于缺乏从知识发现与知识组织视角构建情境与服务关系的方法,缺乏集成多种内容推荐业务的支持性系统的解决方案[4]。由于目前缺少从数据分析、知识管理视角构建情境与用户内容偏好关联的研究,那么在给用户提供服务的工作过程中需要哪些类型的上下文数据,采取何种策略和次序获取并将其与知识库中的目标情境匹配,当存在不完全匹配问题时应采取何种策略等,对于这些后续问题的研究就更加薄弱。本文在前期研究[5]的基础上针对普适推荐服务的目标,结合语义Web服务技术,研究普适个性化内容推荐支持性系统的工作机理,情境化用户偏好知识库的利用过程,建立各种服务之间的逻辑时序关系,以保证服务执行的有序性。
二、基于螺旋模型的服务运作模式
(一)上下文信息获取的依赖关系。
本文将上下文(Context)定义为描述用户情境(Situation)特征的信息。上下文之间具有推理关系、类属关系,一种上下文数据的获取需以另一种数据的获取为前提。在系统实际运行过程中并非时刻对知识库中描述目标情境的所有上下文数据进行一系列的获取、推理和匹配任务。
在情境偏好分析中,处理的是用户与系统交互的历史数据,对描述情境的上下文数据并不需要区分获取时的依赖关系。例如,要获取天气情况的数据,先要获取用户位置数据;要获取用户活动状态信息,首先需获取时间、位置、用户日程等信息再通过推理导出等。然而,在系统的工作过程,并不是时刻对所有的上下文数据进行获取、解释、然后对目标情境进行匹配。因为目标情境中的上下文属性值对之间是合取关系,那么在对目标情境和现实情境的匹配时首先只需得到较容易获取的上下文数据,例如:时间、位置等,当这些上下文数据与情境中的上下文取值匹配时,再获取其它的上下文数据,如:温度数据、用户活动状态等。这样减轻了系统运行的工作负载,利于节省服务资源、降低时间开销和用户费用。图3-1中描述了部分上下文数据获取的依赖关系。这里的主从关系并不同于相关文献中定义的直接和间接上下文,直接上下文是指原始的上下文数据,间接上下文是指通过推理导出的上下文概念。主上下文是指在获取过程中不依赖于其它上下文的类型,而从上下文的获取需要以另一种上下文的获取为前提。当然,具体应用过程中由于感知设备的采用情况不同,这种主从关系并非绝对不变,例如:如果用户移动终端上具有温度感知的功能,那么可以直接由该温度传感器获取温度数据,就不需要先获取用户位置信息再通过调用温度Web服务这种虚拟传感器的方式获取。
(二)服务运作的逻辑。
内容服务的提供过程中需要多种Web服务共同完成,首先需要一个基本的工作逻辑,以协调各种服务之间的关系和动作,因此设计服务运作过程的螺旋模型。螺旋模型最初的概念源于软件工程,它是为了降低由于过多的系统测试或测试不足带来的风险问题而提出的软件开发过程模型。本文将对螺旋模型进行新的定义,主要目的是解决在服务过程中对目标情境进行综合匹配时对于过多的上下文处理或处理不足导致的问题:过多的上下文获取、推理和匹配任务不仅降低了系统运行的效率,同时也增加了为用户提供服务需要付出的代价;而处理不足又会导致推荐决策的盲目性问题。服务运作过程的螺旋模型如图3-2所示:
基本思想是:对于时间上下文的处理采取由粗到细的原则,在总体上下文处理上采取由主到次的原则,逐步地对上下文进行获取和匹配,在综合评价的基础上作出内容推送、类目排序或继续获取上下文数据的决策。图中的原始起点表示不考虑任何动态上下文的情况,即是传统的二维空间方法。例如:若给用户推送某种内容,通过相似性计算的方法在用户偏好数据库中查找到具有该内容偏好的用户,根据用户ID在该用户的情境偏好知识库中选择出可以推送该内容的情境构成待匹配的目标情境集(STS,Set of Target Situations) ,取得其中的主上下文属性:时间、位置,通过设置特定的时间间隔探测的方式,如果时间与某个情境中的时间匹配,则调用位置感知服务取得用户的位置信息判断与该情境中的位置是否匹配,若匹配,再通过调用各种Web服务来获取该情境中其它的上下文信息,然后继续匹配步骤, 直到现实情境与知识库中的某个目标情境的总体匹配度满足要求,则履行推送任务,过程结束,否则需要继续获取下一个上下文类型。若最终的时间匹配度不满足阈值,则放弃该目标情境,进行具有时序关系的下一个目标情境的匹配工作。如:一个目标情境:TSituationi={c1: V1=周末;c2: V2=下午16:30-17:30时段;c3: V3=公园;c4: V4=休息},首先对情境属性c1(表示周时段属性)进行匹配,若匹配程度满足要求,再对c2(表示日时段属性)进行匹配,依次类推,直到总体匹配度满足阈值,则作出推送决策。