CN100576207C - 基于元数据去除重复对象的方法 - Google Patents
基于元数据去除重复对象的方法 Download PDFInfo
- Publication number
- CN100576207C CN100576207C CN 200710106024 CN200710106024A CN100576207C CN 100576207 C CN100576207 C CN 100576207C CN 200710106024 CN200710106024 CN 200710106024 CN 200710106024 A CN200710106024 A CN 200710106024A CN 100576207 C CN100576207 C CN 100576207C
- Authority
- CN
- China
- Prior art keywords
- metadata
- typing
- treatment
- current
- record
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200710106024 CN100576207C (zh) | 2007-05-29 | 2007-05-29 | 基于元数据去除重复对象的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200710106024 CN100576207C (zh) | 2007-05-29 | 2007-05-29 | 基于元数据去除重复对象的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101286156A CN101286156A (zh) | 2008-10-15 |
CN100576207C true CN100576207C (zh) | 2009-12-30 |
Family
ID=40058367
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200710106024 Active CN100576207C (zh) | 2007-05-29 | 2007-05-29 | 基于元数据去除重复对象的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100576207C (de) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102236635A (zh) * | 2010-04-22 | 2011-11-09 | 上海百果信息科技有限公司 | 一种通过捕捉比对关键元素实现多系统信息关联的方法 |
CN102609419B (zh) * | 2011-01-21 | 2015-02-18 | 北京世纪读秀技术有限公司 | 相似数据排重方法 |
CN102609418B (zh) * | 2011-01-21 | 2015-02-04 | 北京世纪读秀技术有限公司 | 数据质量级别判断方法 |
US9223511B2 (en) | 2011-04-08 | 2015-12-29 | Micron Technology, Inc. | Data deduplication |
CN102325347A (zh) * | 2011-09-14 | 2012-01-18 | 中兴通讯股份有限公司 | 一种lte系统中的传输流模板匹配方法及装置 |
US9489133B2 (en) | 2011-11-30 | 2016-11-08 | International Business Machines Corporation | Optimizing migration/copy of de-duplicated data |
CN103166917B (zh) * | 2011-12-12 | 2016-02-10 | 阿里巴巴集团控股有限公司 | 网络设备身份识别方法及系统 |
CN103257961B (zh) * | 2012-02-15 | 2016-08-10 | 北大方正集团有限公司 | 书目消重的方法、装置及系统 |
CN103425711B (zh) * | 2012-05-25 | 2017-08-25 | 株式会社理光 | 基于多对象实例的对象值对齐方法 |
CN103729369B (zh) * | 2012-10-15 | 2017-06-13 | 金蝶软件(中国)有限公司 | 自动处理撞单的方法及装置 |
US20150032609A1 (en) * | 2013-07-29 | 2015-01-29 | International Business Machines Corporation | Correlation of data sets using determined data types |
CN103473654A (zh) * | 2013-09-23 | 2013-12-25 | 国家电网公司 | 一种用于电力erp系统的资产数据清理辅助方法及系统 |
CN104899408A (zh) * | 2014-03-05 | 2015-09-09 | 孙宝文 | 有趣项集获取方法和装置 |
CN105205107A (zh) * | 2015-08-27 | 2015-12-30 | 湖南人文科技学院 | 一种物联网数据相似度处理方法 |
CN106528705A (zh) * | 2016-10-26 | 2017-03-22 | 桂林电子科技大学 | 一种基于rbf神经网络的重复记录检测方法和系统 |
CN108153793A (zh) * | 2016-12-02 | 2018-06-12 | 航天星图科技(北京)有限公司 | 一种原始数据处理方法 |
CN106649650B (zh) * | 2016-12-10 | 2020-08-18 | 宁波财经学院 | 一种需求信息双向匹配方法 |
CN107203686B (zh) * | 2017-03-31 | 2021-04-20 | 苏州艾隆信息技术有限公司 | 药品信息差异处理方法及系统 |
CN107870991A (zh) * | 2017-10-27 | 2018-04-03 | 湖南纬度信息科技有限公司 | 一种论文元数据的相似度计算方法和计算机可读存储介质 |
CN109034199B (zh) * | 2018-06-25 | 2022-02-01 | 泰康保险集团股份有限公司 | 数据处理方法及装置、存储介质和电子设备 |
CN109446190B (zh) * | 2018-11-07 | 2022-11-01 | 湖北省标准化与质量研究院 | 一种标准元数据的数据处理方法 |
CN110941598A (zh) * | 2019-12-02 | 2020-03-31 | 北京锐安科技有限公司 | 一种数据去重方法、装置、终端及存储介质 |
CN111158666B (zh) * | 2019-12-27 | 2023-07-04 | 北京百度网讯科技有限公司 | 实体归一化处理方法、装置、设备及存储介质 |
CN112069510B (zh) * | 2020-07-24 | 2024-01-30 | 北京思特奇信息技术股份有限公司 | 一种数据加密排重方法 |
CN115829143A (zh) * | 2022-12-15 | 2023-03-21 | 广东慧航天唯科技有限公司 | 一种基于时空数据清洗技术的水环境治理预测系统及其方法 |
-
2007
- 2007-05-29 CN CN 200710106024 patent/CN100576207C/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN101286156A (zh) | 2008-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100576207C (zh) | 基于元数据去除重复对象的方法 | |
CN100437582C (zh) | 图像内容语义标注方法 | |
CN104199857B (zh) | 一种基于多标签分类的税务文档层次分类方法 | |
CN101770446B (zh) | 一种版式文件中表格识别方法及系统 | |
CN102681994B (zh) | 一种网页信息抽取方法及系统 | |
CN106066866A (zh) | 一种英文文献关键短语自动抽取方法与系统 | |
WO2003012685A2 (en) | A data quality system | |
CN102567494B (zh) | 网站分类方法及装置 | |
CN104756100A (zh) | 意图估计装置以及意图估计方法 | |
CN104008106A (zh) | 一种获取热点话题的方法及装置 | |
CN111127068B (zh) | 一种工程量清单自动组价方法和装置 | |
CN104484380A (zh) | 个性化搜索方法及装置 | |
CN112364172A (zh) | 一种政务公文领域知识图谱构建方法 | |
CN101894129B (zh) | 基于在线视频分享网站结构及视频描述文本信息的视频主题发现的方法 | |
CN105550253A (zh) | 一种类型关系的获取方法及装置 | |
CN109213998A (zh) | 中文错字检测方法及系统 | |
CN101887415A (zh) | 一种文本文档主题词义的自动提取方法 | |
CN1320481C (zh) | 一种对报纸版面进行标题与正文逻辑关联的方法 | |
CN105243053A (zh) | 提取文档关键句的方法及装置 | |
CN100562872C (zh) | 针对结构化网页的自动模板信息定位方法 | |
CN111898351B (zh) | 基于Aviator的Excel数据自动导入方法、装置、终端设备及存储介质 | |
CN111143457A (zh) | 一种基于多种来源数据集的学者同名排歧方法 | |
CN101246473B (zh) | 一种分词系统的评测方法和一种分词评测系统 | |
CN112883004B (zh) | 一种基于日志聚合的日志知识库与健康度获取方法及系统 | |
CN103870590A (zh) | 具有报错特征的网页识别方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
ASS | Succession or assignment of patent right |
Owner name: LIDE TECHNOLOGY DEVELOPMENT CO., LTD. Free format text: FORMER OWNER: PEKING UNIVERSITY FOUNDER GROUP CORP. Effective date: 20120823 |
|
C41 | Transfer of patent application or patent right or utility model | ||
COR | Change of bibliographic data |
Free format text: CORRECT: ADDRESS; FROM: 100871 HAIDIAN, BEIJING TO: 409000 QIANJIANG, CHONGQING |
|
TR01 | Transfer of patent right |
Effective date of registration: 20120823 Address after: 409000 Zhengyang Industrial Park, Chongqing Patentee after: Leade Technology Development Co., Ltd. Patentee after: Beijing Founder Apabi Technology Co., Ltd. Address before: 100871 Beijing, Haidian District into the house road, founder of the building on the 5 floor, No. 298 Patentee before: Peking Founder Group Co., Ltd. Patentee before: Beijing Founder Apabi Technology Co., Ltd. |