CN100576207C - 基于元数据去除重复对象的方法 - Google Patents

基于元数据去除重复对象的方法 Download PDF

Info

Publication number
CN100576207C
CN100576207C CN 200710106024 CN200710106024A CN100576207C CN 100576207 C CN100576207 C CN 100576207C CN 200710106024 CN200710106024 CN 200710106024 CN 200710106024 A CN200710106024 A CN 200710106024A CN 100576207 C CN100576207 C CN 100576207C
Authority
CN
China
Prior art keywords
metadata
typing
treatment
current
record
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN 200710106024
Other languages
English (en)
Chinese (zh)
Other versions
CN101286156A (zh
Inventor
高飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Leade Technology Development Co., Ltd.
Beijing Founder Apabi Technology Co Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Apabi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Apabi Technology Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN 200710106024 priority Critical patent/CN100576207C/zh
Publication of CN101286156A publication Critical patent/CN101286156A/zh
Application granted granted Critical
Publication of CN100576207C publication Critical patent/CN100576207C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

CN 200710106024 2007-05-29 2007-05-29 基于元数据去除重复对象的方法 Active CN100576207C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200710106024 CN100576207C (zh) 2007-05-29 2007-05-29 基于元数据去除重复对象的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200710106024 CN100576207C (zh) 2007-05-29 2007-05-29 基于元数据去除重复对象的方法

Publications (2)

Publication Number Publication Date
CN101286156A CN101286156A (zh) 2008-10-15
CN100576207C true CN100576207C (zh) 2009-12-30

Family

ID=40058367

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200710106024 Active CN100576207C (zh) 2007-05-29 2007-05-29 基于元数据去除重复对象的方法

Country Status (1)

Country Link
CN (1) CN100576207C (de)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102236635A (zh) * 2010-04-22 2011-11-09 上海百果信息科技有限公司 一种通过捕捉比对关键元素实现多系统信息关联的方法
CN102609419B (zh) * 2011-01-21 2015-02-18 北京世纪读秀技术有限公司 相似数据排重方法
CN102609418B (zh) * 2011-01-21 2015-02-04 北京世纪读秀技术有限公司 数据质量级别判断方法
US9223511B2 (en) 2011-04-08 2015-12-29 Micron Technology, Inc. Data deduplication
CN102325347A (zh) * 2011-09-14 2012-01-18 中兴通讯股份有限公司 一种lte系统中的传输流模板匹配方法及装置
US9489133B2 (en) 2011-11-30 2016-11-08 International Business Machines Corporation Optimizing migration/copy of de-duplicated data
CN103166917B (zh) * 2011-12-12 2016-02-10 阿里巴巴集团控股有限公司 网络设备身份识别方法及系统
CN103257961B (zh) * 2012-02-15 2016-08-10 北大方正集团有限公司 书目消重的方法、装置及系统
CN103425711B (zh) * 2012-05-25 2017-08-25 株式会社理光 基于多对象实例的对象值对齐方法
CN103729369B (zh) * 2012-10-15 2017-06-13 金蝶软件(中国)有限公司 自动处理撞单的方法及装置
US20150032609A1 (en) * 2013-07-29 2015-01-29 International Business Machines Corporation Correlation of data sets using determined data types
CN103473654A (zh) * 2013-09-23 2013-12-25 国家电网公司 一种用于电力erp系统的资产数据清理辅助方法及系统
CN104899408A (zh) * 2014-03-05 2015-09-09 孙宝文 有趣项集获取方法和装置
CN105205107A (zh) * 2015-08-27 2015-12-30 湖南人文科技学院 一种物联网数据相似度处理方法
CN106528705A (zh) * 2016-10-26 2017-03-22 桂林电子科技大学 一种基于rbf神经网络的重复记录检测方法和系统
CN108153793A (zh) * 2016-12-02 2018-06-12 航天星图科技(北京)有限公司 一种原始数据处理方法
CN106649650B (zh) * 2016-12-10 2020-08-18 宁波财经学院 一种需求信息双向匹配方法
CN107203686B (zh) * 2017-03-31 2021-04-20 苏州艾隆信息技术有限公司 药品信息差异处理方法及系统
CN107870991A (zh) * 2017-10-27 2018-04-03 湖南纬度信息科技有限公司 一种论文元数据的相似度计算方法和计算机可读存储介质
CN109034199B (zh) * 2018-06-25 2022-02-01 泰康保险集团股份有限公司 数据处理方法及装置、存储介质和电子设备
CN109446190B (zh) * 2018-11-07 2022-11-01 湖北省标准化与质量研究院 一种标准元数据的数据处理方法
CN110941598A (zh) * 2019-12-02 2020-03-31 北京锐安科技有限公司 一种数据去重方法、装置、终端及存储介质
CN111158666B (zh) * 2019-12-27 2023-07-04 北京百度网讯科技有限公司 实体归一化处理方法、装置、设备及存储介质
CN112069510B (zh) * 2020-07-24 2024-01-30 北京思特奇信息技术股份有限公司 一种数据加密排重方法
CN115829143A (zh) * 2022-12-15 2023-03-21 广东慧航天唯科技有限公司 一种基于时空数据清洗技术的水环境治理预测系统及其方法

Also Published As

Publication number Publication date
CN101286156A (zh) 2008-10-15

Similar Documents

Publication Publication Date Title
CN100576207C (zh) 基于元数据去除重复对象的方法
CN100437582C (zh) 图像内容语义标注方法
CN104199857B (zh) 一种基于多标签分类的税务文档层次分类方法
CN101770446B (zh) 一种版式文件中表格识别方法及系统
CN102681994B (zh) 一种网页信息抽取方法及系统
CN106066866A (zh) 一种英文文献关键短语自动抽取方法与系统
WO2003012685A2 (en) A data quality system
CN102567494B (zh) 网站分类方法及装置
CN104756100A (zh) 意图估计装置以及意图估计方法
CN104008106A (zh) 一种获取热点话题的方法及装置
CN111127068B (zh) 一种工程量清单自动组价方法和装置
CN104484380A (zh) 个性化搜索方法及装置
CN112364172A (zh) 一种政务公文领域知识图谱构建方法
CN101894129B (zh) 基于在线视频分享网站结构及视频描述文本信息的视频主题发现的方法
CN105550253A (zh) 一种类型关系的获取方法及装置
CN109213998A (zh) 中文错字检测方法及系统
CN101887415A (zh) 一种文本文档主题词义的自动提取方法
CN1320481C (zh) 一种对报纸版面进行标题与正文逻辑关联的方法
CN105243053A (zh) 提取文档关键句的方法及装置
CN100562872C (zh) 针对结构化网页的自动模板信息定位方法
CN111898351B (zh) 基于Aviator的Excel数据自动导入方法、装置、终端设备及存储介质
CN111143457A (zh) 一种基于多种来源数据集的学者同名排歧方法
CN101246473B (zh) 一种分词系统的评测方法和一种分词评测系统
CN112883004B (zh) 一种基于日志聚合的日志知识库与健康度获取方法及系统
CN103870590A (zh) 具有报错特征的网页识别方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: LIDE TECHNOLOGY DEVELOPMENT CO., LTD.

Free format text: FORMER OWNER: PEKING UNIVERSITY FOUNDER GROUP CORP.

Effective date: 20120823

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 100871 HAIDIAN, BEIJING TO: 409000 QIANJIANG, CHONGQING

TR01 Transfer of patent right

Effective date of registration: 20120823

Address after: 409000 Zhengyang Industrial Park, Chongqing

Patentee after: Leade Technology Development Co., Ltd.

Patentee after: Beijing Founder Apabi Technology Co., Ltd.

Address before: 100871 Beijing, Haidian District into the house road, founder of the building on the 5 floor, No. 298

Patentee before: Peking Founder Group Co., Ltd.

Patentee before: Beijing Founder Apabi Technology Co., Ltd.