2023.4电脑编程技巧与维护特征分类特征描述释义旅客个人信息特征群Name姓名id_type证件类型id_no身份证号1概述共同犯罪是常见的犯罪形式之一,包括一个或几个隐蔽较深的核心成员,他们往往反侦察能力较强,避免多种留下痕迹的事情。但大数据时代,用数据说话已成为人们的共识,将侦查思维应用于数据分析,通过发掘数据之间的关系,由外围人员牵连暴露出隐秘人员,是一个重要的尝试。铁路是客运行业的支柱形式。在铁路公安侦破的刑事案件中,侵财类犯罪(铁路系统自身财产及旅客的随身财务)、危害铁路运输安全类犯罪(非法携带枪支、弹药、管制刀具、危险物品危及公共安全罪、破坏交通设施罪等)、涉毒犯罪这3种类型在铁路违法犯罪案件中占比较高,也是铁路部门日常打击的重点对象[1]。以上3种都属于共同犯罪高发的犯罪类型,除了在列车上实施犯罪,犯罪分子还经常借助铁路流窜作案,因此,对铁路数据的分析非常必要。2分析基础2.1数据说明常规列车车票的信息中包括姓名、证件类型、身份证号、乘车日期、发车时间、车次号、始发站、终点站、车厢号、座位类型、座位号、票号、票种、售票站点号、取票窗口号、售票时间16个属性字段。为了对字段有更加深层次、更加清晰的了解,可将数据的属性字段分为3种信息特征群,即旅客个人信息特征群、旅客行为信息特征群及铁路信息特征群,这有利于从不同特征群中筛选可用的字段,支持后续的分析。3种信息特征群分别对应的特征描述及释义如表1所示。2.2同行人员的判定规则铁路部门的购票方式主要有两种:互联网线上购票和火车站、代售点购票。经过对互联网线上购票和火车站、代售点购票的实际操作进行分析可以发现,同行人员通过购票软件进行网上购票时,常由一人统一购票;采用线下代售点购票的方式时,常由一人统一购票或选择同一窗口前后排队购买。通过对售票数据中同行人员乘车信息进行深入分析,可以发现以下特征。(1)互联网线上购票同行人购票数据特征。若同行关系人的车票由同一人一次性进行互联网线上购票,则所出车次、发站到站相一致且票号必定相连,此时的票号为7位数字。因为互联网线上购票不考虑出票所需时间,所以购票时间也相同,即为提交订单时间。此时同行人可描述为“车次相同+票号相连+时间相同”。基金项目:公安部科技计划项目———基于大数据的警务人员精准需求研究(2018LLYJSLGA018)。作者简介:杨雁莹(1973—),女,副教授,硕士,研究方向为数据库和数据挖掘;王丹宏(2001—...