CN102999574A - 跨多个不同的内容源来定位相关内容项 - Google Patents

跨多个不同的内容源来定位相关内容项 Download PDF

Info

Publication number
CN102999574A
CN102999574A CN2012104523061A CN201210452306A CN102999574A CN 102999574 A CN102999574 A CN 102999574A CN 2012104523061 A CN2012104523061 A CN 2012104523061A CN 201210452306 A CN201210452306 A CN 201210452306A CN 102999574 A CN102999574 A CN 102999574A
Authority
CN
China
Prior art keywords
content
query
inquiry
data
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012104523061A
Other languages
English (en)
Inventor
B·史蒂文森
A·D·哈梅茨
Q·G·克里斯滕森
J·Z·史密斯
A·加纳汉
C·D·A·埃尔南德斯
R·索马孙达拉姆
B·J·里娜卡
毛帆
G·L·麦克明
J·A·阿尔斯波
M·皮亚塞斯尼
T·巴拉博伊
A·S·马利基
T·R·斯里拉姆
Z·阿里芬
J·D·范
K·贾亚拉曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN102999574A publication Critical patent/CN102999574A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

此处描述了用于跨多个不同的内容源来定位相关内容项的技术。从用户界面接收用于定义查询的查询参数,以便搜索位于多个不同的内容服务器上的多个内容源。基于所接收的查询参数在每个内容服务器上执行本地搜索,并且接收查询统计数据以及关于内容源中与该查询参数匹配的内容项的其他数据。跨各内容服务器聚集查询统计数据并将其呈现在用户界面中。对查询统计数据的呈现可按照每个内容源、从查询中分割的每个查询短语等被拆开。另外,基于所接收的数据来呈现与查询参数相匹配的多个内容项的预览。

Description

跨多个不同的内容源来定位相关内容项
技术领域
本发明涉及跨多个不同的内容源来定位相关内容项。
背景技术
诉讼中所涉及的公司可能有义务定位并向对方律师公开所有相关“证据”。这些证据可包括各种电子内容,包括电子邮件消息、文档以及其他文件、在网站上维护的列表以及其他内容,等等。该电子内容可以位于企业中多个不同类型的内容服务器上,每个内容服务器具有索引和/或搜索信息的不同过程。跨多个服务器标识、保留和处理该电子内容可能是困难的、耗时的以及昂贵的。该公司需要挑选并产生的数据的量可能很大。另外,有效限制所公开的相关电子内容的量的工具的缺乏可能增加由在全部内容被公开之前需要人工审阅所带来的诉讼成本。
本发明所做出的公开正是对于这些和其它考虑而提出的。
发明内容
此处描述了用于跨多个不同的内容源来定位相关内容项的技术。利用此处描述的技术,用户可利用搜索技术来定位来自多个不同内容源(诸如电子邮件服务器、内容站点、文件共享、数据库等)的相关内容项,以便标识、保留和处理以供导出该相关项。例如,参与e-discovery(电子发现)调查的用户可以利用此处描述的系统、方法以及用户界面来针对产生用于导出和公开的相关内容项的项的所标识的“虚拟存档”创建有目标的搜索查询,从而降低需要人工审阅的材料并减少对应诉讼中涉及的成本和风险。
根据各实施例,从用户界面接收用于定义查询的查询参数,以便搜索位于多个不同的内容服务器上的多个内容源。基于所接收的查询参数在每个内容服务器上执行本地搜索,并且接收查询统计数据以及关于内容源中与该查询参数匹配的内容项的其他数据。跨各内容服务器聚集查询统计数据并将其呈现在用户界面中。对查询统计数据的呈现可按照每个内容源、从查询中分割的每个查询短语等被拆开。另外,基于所接收的数据来呈现与查询参数相匹配的多个内容项的预览。
应当理解,上述主题可被实现为计算机控制的装置、计算机进程、计算系统或诸如计算机可读介质等制品。通过阅读下面的详细描述并审阅相关联的附图,这些及各种其他特征将变得显而易见。
提供本发明内容以便以简化形式介绍将在以下具体实施方式中进一步描述的一些概念。本发明内容并不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在将本发明内容用来限制所要求保护的主题的范围。此外,所要求保护的主题不限于解决在本公开的任一部分中所提及的任何或所有缺点的实现。
附图简述
图1是示出由本文呈现的实施例所提供的说明性操作环境和软件组件的多方面的框图;
图2和3是示出根据此处描述的各实施例的用于定义查询的说明性用户界面的屏幕图示,以便跨多个内容源定位内容项并提供关于查询结果的查询统计数据;
图4是示出根据此处描述的各实施例的用于生成查询统计数据的查询分割的多个示例;
图5和6是示出根据此处描述的各实施例的用于预览查询结果的说明性用户界面的屏幕图示;
图7是示出根据此处描述的实施例的用于接受对查询结果的细化的说明性用户界面的屏幕图示;
图8是示出根据此处描述的实施例的用于管理多个已保存的查询的说明性用户界面的屏幕图示;
图9是示出根据此处描述的实施例的一种用于跨多个不同的内容源来定位相关内容项的方法的流程图;以及
图10是示出能够实现本文呈现的实施例的多方面的计算系统的说明性计算机硬件和软件体系结构的框图。
具体实施方式
以下详细描述涉及用于跨多个不同的内容源来定位相关内容项的技术。尽管在结合计算机系统上的操作系统和应用程序的执行而执行的程序模块的一般上下文中提出了本文描述的主题,但是本领域技术人员将认识到,其他实现可以结合其他类型的程序模块来执行。一般而言,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、组件、数据结构和其他类型的结构。此外,本领域技术人员将明白,可以利用其他计算机系统配置以实施本文描述的主题,这些计算机系统配置包括手持式设备、多处理器系统、基于微处理器的或可编程消费电子产品、小型计算机、大型计算机等等。
在以下详细描述中,参考了构成其一部分并作为说明示出各具体实施例或示例的附图。在附图中,在全部若干附图中相似的附图标记表示相似的元素。
图1示出根据此处提供的各实施例的、包括用于跨多个不同的内容源来定位相关内容项的软件组件的说明性操作环境100。环境100包括计算机系统102。在一个实施例中,计算机系统102表示执行基于web的应用程序的并且由用户104使用在用户计算设备106上执行的web浏览器或其他客户机应用通过网络108访问的一个或多个web和/或应用服务器,网络108可以是局域网(“LAN”)、广域网(“WAN”)、因特网、或本领域已知的将用户计算设备106连接到计算机系统102的任何其他联网拓扑。用户计算设备可包括个人计算机(“PC”)、桌面工作站、膝上型计算机、笔记本、平板设备、移动设备、个人数字助理(“PDA”)、游戏控制台、机顶盒、消费电子设备,等等。或者,计算系统102可表示本地地执行应用程序的用户计算设备、或服务器计算机与用户计算设备的任意组合。
e-discovery客户机应用110可以在计算机系统102上执行。用户104可利用e-discovery客户机应用110来标识、保留并导出与业务问题或事件(诸如诉讼或其他法律事务)有关的一组内容项。具体而言,e-discovery客户机应用110可以允许用户104产生有目标的搜索查询来从包括存储在多个内容源114中的内容项112的“虚拟存档”中定位相关内容项。e-discovery客户机应用110还可向用户104提供预览搜索返回的内容项112、细化查询、以及分派供导出的相关内容项112列表的能力。内容源114的示例可包括电子邮箱,文档库、列表项存档、例如讨论线程或web日志(“博客”)或其他内容站点;文件共享或文件共享文件夹;网站;等等。内容项112的示例可包括电子邮件消息;文档或文件;网页;列表项(例如,讨论线程中的条目、博客帖子、wiki页面条目)等等。根据各实施例,内容项112可被存储在多个不同的内容服务器116A-116N(此处也常被称为内容服务器116)上、和/或通过这些服务器来访问。
在一个实施例中,内容服务器116包括一个或多个电子邮件服务器,如来自华盛顿州雷蒙德市的微软公司的
Figure BDA00002393943800041
EXCHANGE SERVER电子邮件服务器。内容服务器116还可包括一个或多个内容站点服务器,如同样来自微软公司的
Figure BDA00002393943800042
服务器。内容服务器116还可包括一个或多个文件服务器、NAS存储设备、或其他文件和文档存储系统。在其他实施例中,内容服务器116可包括文档管理服务器、数据库服务器、web服务器、以及本领域已知的其他数据和内容服务器。
根据其它实施例,每个内容服务器116A-116N可以提供用于搜索存储在内容服务器上和/或通过内容服务器来访问的内容项112的对应的搜索界面118A-118N(此处也被称为搜索界面118)。例如,包括电子邮件服务器的内容服务器116A可提供搜索界面118,该搜索界面118允许诸如在计算机系统102上执行的e-discovery客户机应用110等外部应用来搜索包括电子邮件消息的内容项112,该电子邮件消息包含在包括电子邮箱的内容源114中。在一个实施例中,内容服务器116维护支持通过搜索界面118对相关联的内容项112的搜索的一个或多个索引。搜索界面118可包括应用编程接口(API),该应用编程接口定义了基于SOAP的web服务、Java RMI调用、
Figure BDA00002393943800043
通信基础(WFC)服务、RPC调用等。
e-discovery客户机应用110可以访问定义各种内容源114的案件数据集120,内容源114包含内容项112,内容项112包括待搜索的项的虚拟存档。案件数据集120可表示XML文件、数据库中的一个或多个数据库表、或本领域已知的存储在计算机系统102上或可由计算机系统102访问的任何其他结构化存储机制。案件数据集120可由用户104利用e-discovery客户机应用110或另一应用、基于被视为与手边的诉讼其他业务问题/事件潜在相关的内容源来构建。在一个实施例中,案件数据集120可由用户104使用与此处描述的用于定位虚拟存档中的相关内容项112相类似的方法和用户界面来构建。
案件数据库120可包含一个或多个内容集合122,每一内容集合122包括一个或多个源规范124A-124N(此处也被称为源规范124)。每一源规范124可以标识包含共同组成虚拟存档的内容项112的特定内容源114。例如,一个源规范124A可标识存储在电子邮件内容服务器116A上或通过电子邮件内容服务器116A访问的特定个人邮箱。另一源规范124B可以标识通过托管内容站点的内容服务器116B访问的文档库。将源规范124组织成内容集合122允许在内容集合级应用用于虚拟存档的配置选项,诸如内容项112是否应被原地保留、或被复制到存档等。另外,可以在内容集合级应用过滤器以进一步限制来自指定内容源114的要被包括在虚拟存档中的内容项112。过滤器可包括所发送的电子邮件消息或所创建或修改的文档的日期范围、文档或电子邮件消息的作者/发件人、关键字过滤器,等等。在其他实施例中,还可在内容源级(即按源规范124)指定过滤器,或对案件数据集120中定义的整个虚拟存档来指定。
案件数据库120还可包含一个或多个查询规范126。每一查询规范126定义用来搜索内容源114的查询,该内容源114包含由源规范124定义来定位相关内容项112的虚拟存档。根据各实施例,用户可利用e-discovery客户机应用110来构建查询规范126并将其保存到案件数据集120。e-discovery客户机应用110还可解析查询规范126,并利用源规范124所标识的每一内容服务器116的搜索界面118来针对每个内容源114执行查询。如下面将更详细地描述的,与针对每个内容源114执行的查询有关的统计数据随后可由e-discovery客户机应用110来聚集,并被呈现给用户104。另外,e-discovery客户机应用110可组合关于由每个内容服务器116定位的内容项112的数据,以便向用户104呈现对结果的预览,以允许对查询进行进一步细化。
最后,e-discovery客户机应用110可生成由查询从各个内容源114定位的全部相关内容项112的清单。该清单随后可被分派给导出应用,该导出应用可利用每个内容服务器116的附加界面来检索清单中指定的内容项112并将其保存到案件导出文件,诸如2011年11月10日提交的共同待决美国专利申请号13/293,146中描述的,该专利申请的代理人档案号为334054.01,并且题为“Export of Content Items from Multiple,Disparate Content Sources(从多个不同的内容源导出内容项)”,该专利申请通过全部引用而包含于此。
图2示出用于定义查询以搜索虚拟存档的内容源114的说明性用户界面(“UI”)200,该虚拟存档的内容源114由案件数据集120中包含的源规范124来定义。UI 200可由e-discovery客户机应用110在例如在用户计算设备106上执行的web浏览器应用所呈现的浏览器窗口202中呈现给用户104。
UI 200包括查询规范部分206,其中定义查询的参数可由用户104来指定。例如,查询规范部分206可包含允许用户以任何合适的句法来指定自由文本查询208(诸如关键字查询语言(KQL)查询)的字段,该字段可包括查询的关键字以及连接词、分组括号等。在一个实施例中,自由文本查询208还可包括例如高级查询句法/规范,诸如使用“属性:值(property:value)”语法的属性限制。根据各实施例,自由文本查询208的句法可独立于每一内容服务器116的搜索界面118所要求的用来搜索内容源114的查询的形式或句法。e-discovery客户机应用110可在执行该查询时解析自由文本查询208,并将该查询转换成针对内容服务器116的正确形式和/或句法。
查询规范部分206还可包含允许用户104指定为查询定义日期范围参数的from-date(起始日期)值210和to-date(到达日期)值212的字段。取决于内容项的类型,日期范围参数可被应用于内容项112的各特定属性,如电子邮件消息的发送日期、文档或文件的创建或修改日期、讨论条目的发帖日期,等等。查询规范部分206还可包含允许用户104指定author/sender(作者/发送者)参数214的字段。与日期范围参数相类似,取决于内容项的类型,author/sender参数214可被应用于内容项112的特定属性,诸如电子邮件消息的发件人、文档的创建者、讨论条目的发帖人,等等。
UI 200还可包括用于指定被定义的查询的范围的机制,即要向其应用查询的虚拟存档的那些内容源114。例如,UI 200可包括scope(范围)UI控件216,该控件在被用户104选中时使得在窗口202中显示查询范围规范面板302,如图3所示。查询范围规范面板302可包括内容项分组(诸如与案件数据集120中包含的内容集合122和/或源规范214对应的内容项分组304A-304D)列表。另外,可以按照分层的方式来呈现内容项分组304A-304D。例如,内容项分组304A可以对应于案件数据集120中定义的第一内容集合122,而内容项分组304B-304D可对应于三个内容源114的源规范124,一个对应于“Adam Barr”的个人邮箱,一个对应于“Regina Wilcox”的个人邮箱,以及一个对应于位于“\\PUBLIC\ADAM BARR”的文件共享,其中每一个都包括在第一内容集合122中。
每个内容项分组304A-304D还可包括inclusion(包含)UI控件308,该控件308允许用户104指定是否将对应的源规范124或内容集合122所标识的内容源114包括到正被定义的查询范围中。查询范围规范面板302还可包括全选UI控件310,该控件310允许用户104指定将案件数据集120所标识的全部内容源114都包括到搜索中。
返回图2,UI 200还可包括源查询统计数据部分220,该源查询统计数据部分220向用户104提供与针对查询范围中标识的内容源114执行已定义查询有关的查询统计数据222。例如,用户可利用执行查询UI控件218来使e-discovery客户机应用110解析查询参数并利用源规范124所标识的每个内容服务器116的搜索界面118来针对指定的内容源114执行本地查询。与针对每个内容源114执行的查询有关的查询统计数据222随后可由e-discovery客户机应用110来聚集,并在UI 200的源查询统计数据部分220中呈现。
根据一个实施例,查询统计数据222可包括内容源条目(诸如与查询范围中包括的每个内容源114对应的内容源条目224)列表。内容源条目224可包括如在226所示的对应内容源114的标识符、如在228所示的在内容源中定位的与查询参数匹配的内容项112的数量的计数、如在230所示的所定位的内容项的总大小、等。查询统计数据中的内容源条目224还可被进一步分组到分组标题232A-232C下。例如,可按对应的内容源114的类型对内容源条目224进行分组,如图2所示。还可按内容集合122、按内容服务器116或按其他分组对内容源条目224进行分组。在一个实施例中,对查询统计数据中的与内容源114相对应的内容源条目224的分组可由用户104通过UI 200来选择。查询统计数据222还可包括所定位的内容项112的计数和/或大小的部分和以及总和、所定位的项占内容源114中总内容项的百分比等。
UI 200还可包括查询分割统计数据部分240,该部分向用户104提供与已定义查询的执行有关的附加查询统计数据222。附加查询统计数据222还可包括如在242所示的查询所定位的、查询参数中指定的自由文本查询208的各个短语(诸如查询短语244)所分解的内容项122的计数。对查询的分割可由e-discovery客户机应用110通过各种方式来执行。如图4中404A处所示的,在一个实施例中,查询可在每个显式或隐式OR处被划分成查询短语244A-244N,诸如从查询402的主体中分割的查询短语244A和244B。
分割过程可基于查询402中通过括号的显式分组或查询中基于运算符优先顺序、句法等的隐式分组来迭代地执行。例如,可使用同一过程将查询短语244B进一步分割成查询短语244C-244H。可以通过表示查询402中分组的分层方式来呈现所得到的查询短语244A-244N。在另一实施例中,查询402可在每个显式或隐式AND处被划分成查询短语244,如图4中404B处所示。如图2所示,还在查询分割统计数据部分240中示出与每个查询短语244相匹配的内容项112的计数。内容服务器116可为每个查询短语244生成该计数,和/或e-discovery客户机应用110可使用每一个别的查询短语244来执行搜索操作,以便聚集查询统计数据222以供在查询分割统计数据部分240中呈现。应当理解,用户每次修改查询参数或为查询定义的查询参数时,可以更新源查询统计数据部分220和查询分割统计数据部分240中呈现的查询统计数据222。
图5示出向用户提供对内容项112的预览的另一个说明性UI 500,该内容项112由在查询规范部分206中定义的查询来定位。如上所述,e-discovery客户机应用110还可向用户104提供预览搜索返回的内容项112以及进一步细化查询的能力,以便仅定位相关内容项以供导出。UI 500可由e-discovery客户机应用110在例如在用户计算设备106上执行的web浏览器应用所呈现的浏览器窗口202中呈现给用户。除了上面参考图2-4描述的UI 200以外或作为其替换,e-discovery客户机应用110可以呈现UI 500。
UI 500包括详细说明为查询定义的参数的查询规范部分206以及结果列表502,该结果列表502包含诸如内容项条目506的内容项条目,该内容项条目包含与匹配于搜索参数的每个已预览内容项112有关的数据。可以为不同类型的内容源114提供不同的结果列表502,该结果列表502可由用户通过如图5所示的选项卡象征或者通过本领域已知的另一UI机制来选择。例如,每种类型的内容源114类别可具有示出结果列表502的对应选项卡504A-504C,该结果列表502包含专用于该类型的内容项112的数据。例如,对于包含电子邮箱的内容源114,“MAILBOXES(邮箱)”选项卡504A上的结果列表502中的每个内容项条目506可包括对应电子邮件消息的头信息,诸如主题、接收者、发送者、发送的日期等。对于包含文档库或文件共享的内容源114,“FILESHARES(文件共享)”选项卡504C上的结果列表502中的每个内容项条目506可包括文件的对应文档的摘要信息,诸如文档标题或文件名、文件类型、作者、创建日期、最近修改日期等。
在另一实施例中,结果列表502中的内容项条目506可包含来自已预览的内容项112的附加数据,诸如电子邮件消息的主体的前几行、文档或文件的缩略图图像等。在另一实施例中,每个选项卡504A-504C对应于从内容源114得到显露的内容项112的搜索机制或索引。因此,包含来自电子邮箱的电子邮件消息以及来自文件共享的文件的结果列表502可被列在对应于企业范围搜索索引的“企业(ENTERPRISE)”选项卡下面,而来自文档库的文档以及来自博客或讨论分组的列表项可以出现在位于“内容站点(CONTENT SITES)”选项卡504B下面的结果列表中,该“内容站点”选项卡504B对应于来自一个或多个内容站点的搜索索引。在又一实施例中,每个选项卡504A-504C可对应于一种类型的内容服务器116、特定的内容服务器、或其他类别或分组的内容项112、内容源114和/或内容服务器。
e-discovery客户机应用110可基于例如用于在结果列表502中显示的默认或用户可选择的排序顺序,从所标识的内容服务器116中为对应于所选选项卡504A-505C的类型的前N个匹配的内容项112检索头或摘要信息。可通过对应的搜索界面118或通过专用于内容服务器类型的另一API从内容服务器116中检索该头或摘要信息。另外,当用户104修改查询时和/或当在UI 200中更新查询统计数据222时,数据可由e-discovery客户机应用110异步地检索。另外,如图6所示,当结果列表502中的对应内容项条目506被用户通过例如在该条目上方悬停鼠标指针604选中时,e-discovery客户机应用110可检索内容项112的整个内容并将其显示在预览窗格602中。
现在参考图7,UI 500还可包含允许用户104作出对查询的进一步细化的查询细化部分508。查询细化部分508可包含可为其选择查询细化的值的属性列表或“过滤器类别”704A-704D(此处一般被称为过滤器类别704)。向用户104呈现的过滤器类别704可以是正在为其呈现的已预览内容项112的内容源114的类型所专用的。例如,如图7中所示,如果电子邮件消息正在“MAILBOXES”选项卡504A上的结果列表502中被预览,则过滤器类别704A-704D可包括电子邮件消息的属性,诸如接收者、域、邮件类型、附件类型等。可以通过包括不同类型的内容项112的其他选项卡504B、504C上的结果列表502来示出附加和/或替换的过滤器类别704。
如果用户104选择诸如过滤器类别704A的特定过滤器类别,则还可向该用户呈现根据已预览内容项112生成的所选过滤器类别的值条目(例如值条目706)的列表。在一个实施例中,所列出的每个值条目706还可包括查询统计数据,该查询统计数据示出了内容项112的计数,该内容项112来自具有匹配于对应值的属性的当前查询,如图7进一步所示的。用户104可选择所选过滤器类别704的所列值条目706中的一个或多个,并且随后选择诸如应用按钮UI控件710的UI控件,以向查询应用所选的过滤器类别/值对。向查询应用所选的过滤器类别/值对既可更新在UI 200中呈现的查询统计数据222,又可更新在当前所选选项卡504A上的结果列表502中示出的已预览内容项112。在另一个实施例中,使用例如“属性:值”句法,将所选的过滤器类别/值对添加到查询参数中的自由文本查询208。用户104随后可重新排列、分组和改变自由文本查询208中过滤器类别/值对的连接运算符,以进一步细化该查询。
根据一个实施例,在给定时间,只有一个过滤器类别704A-704D可以打开并被修改。如果用户104正在修改一个过滤器类别704A并接着在选择应用按钮UI控件710之前切换到另一个过滤器类别,则e-discovery客户机应用110可警告用户对过滤器类别的任何改变将不会被保存,除非他们选择应用按钮。在另一个实施例中,向用户104提供定制过滤器UI控件708,该定制过滤器UI控件708允许用户指定过滤器类别704A-704D之一的未列出的值、和/或指定另一属性的值或内容源类型的除所示过滤器类别以外的过滤器类别的值。选择定制过滤器UI控件708可将该UI控件变成文本框,其中用户可例如按照“属性:值”句法来输入附加的过滤器类别/值对。
UI 500还可包括查询保存部分712,该查询保存部分712允许将查询保存为案件数据集120中对应的查询规范126,如上面参考图1所描述的。可向用户呈现提供名称或其他标识符以与查询规范126相关联的UI控件。根据各实施例,查询的全部查询参数被保存到对应的查询规范126,查询参数包括自由文本查询208、日期范围参数、作者/发送者参数214、源规范124和/或包括查询范围的内容集合122、在查询细化部分508中选择的任何过滤器类别/值对等。另外,内容服务器116最后生成的查询统计数据222可与对应的查询规范126一同存储,以供稍后检索。在一个实施例中,可向用户104提供从现有的查询规范126复制查询参数来创建新查询的能力,该新查询可随后在现有的查询规范126保持完整的情况下被修改。
图8示出根据其他实施例的用于管理已保存的查询的另一说明性UI 800。UI 800可由e-discovery客户机应用110在例如在用户计算设备106上执行的web浏览器应用所呈现的浏览器窗口202中呈现给用户104。UI 800可包括包含针对存储在案件数据集120中的查询规范126的查询条目(如查询条目804)的查询列表802。当由用户104保存时,每一查询条目804可包括来自查询规范126的自由文本查询806、以及与查询相关联的名称808或其他标识符。另外,查询条目804可包括查询统计数据222,诸如与查询匹配的内容项112的总计数810和总大小812。当用户104保存查询时,来自对查询的最后执行的查询统计数据222可以已经与对应的查询规范126一同被存储,如上面参考图7所描述的。
根据各实施例,每一查询条目804还可包括允许用户104从查询列表804中选择一个或多个查询的查询选择控件814。用户104随后可选择导出UI控件816,该UI控件816将使e-discovery客户机应用110跨全部内容服务器116生成来自全部内容源114的与所选查询中的一个或多个相匹配的全部相关内容项112的清单,并将该清单分派给导出应用,该导出应用检索指定的内容项112并将它们保存到案件导出文件,如上面参考图1所描述的。
现在参考图9,将提供关于此处呈现的实施例的附加细节。应当理解,参考图9所述的逻辑操作被实现为(1)在计算系统上运行的一系列计算机实现的动作或程序模块和/或(2)计算系统内的互连机器逻辑电路或电路模块。该实现是取决于计算系统的性能及其他要求的选择问题。因此,此处所描述的逻辑操作被不同地称为操作、结构设备、动作或模块。这些操作、结构设备、动作和模块可以用软件、固件、专用数字逻辑、及其任何组合来实现。还应该明白,可以执行比附图中示出并在此处描述的操作更多或更少的操作。这些操作还可按与所述次序不同的次序来执行。
图9示出根据一个实施例的、用于跨多个不同的内容源来定位相关内容项的一个例程900。例程900可由例如在计算机系统102上执行的e-discovery客户机应用110来执行。应当理解,例程900也可由在计算机系统102上执行的其他模块或组件执行,或者由模块、组件和计算设备的任何组合来执行。例程900在操作902开始,其中e-discovery客户机应用110向用户104呈现UI,以便定义查询来搜索如由案件数据集120中包含的源规范124所定义的虚拟存档的内容源114。根据各实施例,源规范124可标识多个不同的内容服务器116上的内容源114,诸如电子邮件服务器上的电子邮箱、内容站点服务器上的文档库、和/或文件服务器上的文件共享。
e-discovery客户机应用110可向用户104呈现上面参考图2和3描述的UI 200以定义查询。UI 200可由e-discovery客户机应用110在例如在用户计算设备106上执行的web浏览器应用所呈现的浏览器窗口202中呈现给用户104。UI 200可包括查询规范部分206,该查询规范部分206允许用户指定定义查询的参数,诸如自由文本查询208、日期范围参数、作者/发送者参数214等。UI200还可包括查询范围规范面板302,该查询范围规范面板302允许用户指定案件数据集120中包含的向其应用查询的内容集合122和/或源规范124。
例程900从操作902行进至操作904,如上所述,其中e-discovery客户机应用110通过UI 200从用户104接收查询参数和/或查询范围。在另一实施例中,用户104可从先前保存到案件数据集120的查询规范126中加载查询参数和查询范围。例程900从操作904行进至操作906,其中e-discovery客户机应用110执行对在包含查询范围的源规范124中指定的每个内容服务器的本地搜索。如上所述,e-discovery客户机应用110可解析查询参数,并利用源规范124所标识的每一内容服务器116的搜索界面118来针对指定的内容源114执行本地查询。根据一个实施例,e-discovery客户机应用110可向用户104提供用户界面,以查看和/或修改为各个内容服务器116生成的本地查询。
例程900从操作906行进至操作908,其中e-discovery客户机应用110从内容服务器116接收与针对每一内容源114执行的查询有关的查询统计数据222。e-discovery客户机应用110可接收由内容源114中的一个或多个来分解的原始统计数据、从自由文本查询208中分割的查询短语244等。应当理解,从内容服务器116接收的查询统计数据222可包括不同级的各种信息,并且不同类型的内容服务器116可从查询返回不同级的查询统计数据。在一个实施例中,e-discovery客户机应用110接收与匹配于查询的内容源114中的内容项112有关的头或摘要信息,并且e-discovery客户机应用根据该信息生成查询统计数据222。
在操作910,e-discovery客户机应用110聚集与从内容服务器116接收的各个内容源114有关的查询统计数据222,并将已聚集的统计数据呈现给用户104。e-discovery客户机应用110可呈现由包括在查询范围中的每个内容源114分解的查询统计数据222,如在上面参考图2描述的UI 200的源查询统计数据部分220中所示的。查询统计数据222还可包括所定位的内容项112的计数和/或大小的部分和以及总和、所定位的项占内容源114中总内容项的百分比等。e-discovery客户机应用110还可呈现由查询的各个短语分解的查询统计数据222,如在上面参考图2和4描述的UI 200的查询分割统计数据部分240中所示的。
例程900从操作910行进至操作912,其中e-discovery客户机应用110检索与匹配于查询参数的各个内容源114中的内容项112有关的数据。如上面参考图5描述的,e-discovery客户机应用110可基于例如默认的或用户可选择的排序顺序从所标识的内容服务器116中检索多个匹配的内容项112的头信息或摘要信息。可通过对应的搜索界面118或通过内容服务器类型专用的另一API从内容服务器116中检索该头信息或摘要信息。
例程900从操作912行进至操作914,其中e-discovery客户机应用110向用户104呈现检索到的头信息或摘要信息,作为对匹配的内容项112的预览。例如,e-discovery客户机应用110可以呈现上面参考图5所描述的UI 500,该UI 500允许用户按照内容源类型来预览匹配的内容项112。在一个实施例中,可以在每个内容服务器116处为该内容服务器或相似的内容服务器所服务的内容源114去重复已预览内容项112。在另一实施例中,e-discovery客户机应用110可在向用户104呈现查询统计数据222和/或已预览内容项112之前跨内容源114和内容服务器116来执行附加的或替换的匹配内容项112的去重复。
例程900从操作914行进至操作916,其中e-discovery客户机应用110可接收对查询的改变或细化。例如,用户104可改变UI 200的查询规范部分206中的查询参数中的一个或多个、或查询范围规范面板302中的查询范围,如上面参考图2和3描述的。用户104可附加地或替换地选择或指定来自上面参考图7描述的UI 500的查询细化部分508的一个或多个过滤器类别/值对。如果接收到对查询的改变或细化,则例程900返回到操作906,其中e-discovery客户机应用110针对每个内容服务器116重新执行经修改的查询,并且收集查询统计数据222和已预览内容项112并将其呈现给用户104,如上所述。如果e-discovery客户机应用110在操作916没有接收到对查询的改变或细化,则例程900结束。
图10示出了能够执行此处描述的用于以上文呈现的方式跨多个不同的内容源来定位相关内容项的软件组件的计算机1000的示例计算机体系结构。图10所示的计算机体系结构示出服务器计算机、常规台式计算机、膝上型计算机、笔记本计算机、平板计算机、PDA、无线电话、或其他计算设备,并可以用来执行此处呈现的被描述为在计算机系统102、用户计算设备106、和/或其他计算设备上执行的软件组件的任何方面。
图10所示的计算机体系结构包括一个或多个中央处理单元(“CPU”)1002。CPU 1002可以是执行计算机1000的操作所需的算术和逻辑操作的标准处理器。CPU 1002通过从一个分立的物理状态转换到下一状态来执行必要的运算,该转换是通过操纵在各状态之间不同并改变这些状态的开关元件来实现的。切换元件一般可包括维持两个二进制状态之一的电子电路,诸如触发电路,以及基于一个或多个其它切换元件的状态的逻辑组合来提供输出状态的电子电路,诸如逻辑门。这些基本切换元件可被组合以创建更复杂的逻辑电路,包括寄存器、加减器、算术逻辑单元、浮点单元和其它逻辑元件。
该计算机体系结构还包括含有随机存取存储器(“RAM”)1014和只读存储器1016(“ROM”)的系统存储器1008、以及将存储器耦合至CPU 1002的系统总线1004。基本输入/输出系统被存储在ROM 1016中,该系统包含帮助诸如在启动期间在计算机1000中的元件之间传递信息的基本例程。计算机1000还包括用于存储操作系统1018、应用程序和其它程序模块的大容量存储设备1010,这将在本文中更为详尽地描述。
大容量存储设备1010通过连接至总线1004的大容量存储控制器(未示出)连接到CPU 1002。大容量存储设备1010为计算机1000提供非易失性存储。计算机1000可通过变换大容量存储设备1010的物理状态来反映被存储的信息来将信息存储在该设备上。在本说明书的不同实现中,物理状态的具体变换可取决于各种因素。这些因素的示例可以包括,但不仅限于:用于实现大容量存储设备的技术,大容量存储设备被表征为主存储还是辅存储等等。
例如,计算机1000可通过向大容量存储控制器发出以下指令来将信息存储到大容量存储设备1010:变更磁盘驱动器内的特定位置的磁特性;变更光存储设备中的特定位置的反射或折射特性;或变更固态存储设备中的特定电容、晶体管或其它分立元件的电特性。在不背离本发明的范围和精神的情况下,物理介质的其它变换是可能的。计算机1000还可通过检测大容量存储设备内的一个或多个特定位置的物理状态或特性来从大容量存储设备1010读取信息。
如上简述,多个程序模块和数据文件可存储在计算机1000的大容量存储设备1010和RAM 1014中,包括适用于控制计算机的操作的操作系统1018。大容量存储设备1010和RAM 1014还可以存储一个或多个程序模块。具体而言,大容量存储设备1010和RAM 1014可存储e-discovery客户机应用110,这曾在上文中参考图1更详细地描述。大容量存储设备1010和RAM 1014还可存储其它类型的程序模块或数据。
除了上述大容量存储设备1010之外,计算机1000能够访问其它计算机可读介质以存储和检索信息,诸如程序模块、数据结构或其它数据。本领域技术人员应该明白,计算机可读介质可以是计算机1000可访问的任何可用介质,包括计算机可读存储介质和通信介质。通信介质包括瞬时信号。计算机可读存储介质包括以存储如计算机可读指令、数据结构、程序模块或其它数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。例如,计算机可读存储介质包括但不限于,RAM、ROM、EPROM、EEPROM、闪存或其它固态存储器技术,CD-ROM、数字多功能盘(DVD)、HD-DVD、蓝光、或其它光学存储、磁带盒、磁带、磁盘存储或其它磁存储设备,或可以用来存储所需信息并可由计算机1000访问的任何其它介质。
计算机可读存储介质可以用在被加载到计算机1000中时可将计算机系统从通用计算系统变换成能够实现本文描述的实施例的专用计算机的计算机可执行指令来编码。计算机可执行指令可通过变更计算机可读存储介质中的特定位置的电、光、磁或其它物理特性来在该介质上编码。这些计算机可执行指令通过如上所述地指定CPU 1002如何在各状态之间转换来变换计算机1000。根据一个实施例,计算机1000能够访问存储计算机可执行指令的计算机可读存储介质,所述指令在由计算机执行时执行以上参照图9描述的用于跨多个不同的内容源来定位相关内容项的例程900。
根据各种实施例,计算机1000可使用通过一个或多个网络108到远程计算设备和计算机系统的逻辑连接在联网环境中操作,所述网络诸如LAN、WAN、因特网或本领域已知的任何拓扑结构的网络。计算机1000可以通过连接到总线1004的网络接口单元1006连接到网络1020。应当理解,网络接口单元1006还可以被用来连接到其他类型的网络和远程计算机系统。
计算机1000还可包括用于接收和处理来自包括键盘、鼠标、触摸垫、触敏显示器、电子指示笔、或其它类型的输入设备等一个或多个输入设备的输入的输入/输出控制器1012。类似地,输入/输出控制器1012可向诸如计算机监视器、平板显示器、数字投影仪、打印机、绘图仪或其它类型的输出设备等显示设备提供输出。可以明白,计算机1000可以不包括图10所示的全部组件,可以包括未在图10中明确示出的其它组件,或者可使用完全不同于图10所示的体系结构。
基于以上描述,应当明白,本文提供了用于跨多个不同的内容源来定位相关内容项的技术。虽然以计算机结构特征、方法动作、以及计算机可读存储介质专用的语言描述了本文呈现的主题,但是应该理解,在所附权利要求书中所限定的本发明不一定仅限于本文描述的具体特征、动作、或介质。相反,这些具体特征、动作和介质是作为实现权利要求的示例形式来公开的。
上述主题仅作为说明提供,并且不应被解释为限制。可对此处所述的主题作出各种修改和改变,而不必遵循所示和所述的示例实施例和应用,且不背离所附权利要求书中所述的本发明的真正精神和范围。

Claims (10)

1.一种用于定位跨不同内容服务器的多个内容源中的内容项的计算机执行的方法,所述方法包括:
从用户接收关于查询的查询参数和查询范围(904),所述查询范围包括位于至少两个不同类型的内容服务器上的内容源;
接收关于内容项的数据(908),所述内容项是通过基于所述查询参数在所述至少两个内容服务器中每一个上执行的本地搜索来定位的;
根据所接收的数据,聚集跨所述至少两个内容服务器的查询统计数据(910);以及
向所述用户呈现所述查询统计数据(914)。
2.如权利要求1所述的计算机执行的方法,其特征在于,呈现关于包含所述查询范围的所述多个内容源中每一个的查询统计数据。
3.如权利要求2所述的计算机执行的方法,其特征在于,按照内容源类型将关于所述多个内容源中每一个的查询统计数据分组到一起。
4.如权利要求1所述的计算机执行的方法,其特征在于,呈现关于多个查询短语中每一个的查询统计数据,所述多个查询短语是从包含所述查询参数的自由文本查询中分割得到的。
5.如权利要求4所述的计算机执行的方法,其特征在于,从所述自由文本查询中在每个显式或隐式OR连接处分割所述多个查询短语。
6.如权利要求1所述的计算机实现的方法,其特征在于,还包括:
根据所接收的数据,向所述用户呈现对匹配于所述查询的一个或多个内容项的预览(914),其中呈现对来自同一类型的内容源的内容项的一个或多个内容项的预览。
7.如权利要求1所述的计算机实现的方法,其特征在于,还包括:
从所述用户接收对所述查询参数的修改(916);
接收关于所述内容项的数据(908),所述内容项是通过基于经修改的查询参数在所述至少两个内容服务器中每一个上重新执行的本地搜索来定位的;以及
一旦接收所述数据,更新向所述用户呈现的所述查询统计数据(914)。
8.如权利要求1所述的计算机实现的方法,其特征在于,还包括:
基于所接收的数据,向所述用户呈现过滤器类别(704)以及所述过滤器类别(704)的一个或多个值;
从所述用户接收对所述过滤器类别(704)的所述一个或多个值之一的选择;
基于所述选择来修改对应内容服务器的所述查询参数(916),以包括过滤器类别/值对;
接收关于所述内容项的数据(908),所述内容项是通过基于经修改的查询参数的对所述对应内容服务器的本地搜索来定位的;以及
一旦接收所述数据,更新向所述用户呈现的所述查询统计数据(914)。
9.如权利要求1所述的计算机执行的方法,其特征在于,所述至少两个内容服务器中的第一个包含电子邮件服务器,并且所述至少两个内容服务器中的第二个包含内容站点服务器。
10.一种用于定位跨不同内容服务器的多个内容源中的内容项的系统,所述系统包括:
一个或多个处理器(1002);
耦合到所述一个或多个处理器(1002)的存储器(1008,1010);以及
驻留在所述存储器(1008、1010)中并包括计算机可执行指令的e-discovery客户机应用(110),所述指令在由所述一个或多个处理器(1002)执行时使得所述系统:
呈现用于定义查询的用户界面(902),以便搜索所述多个内容源,
接收关于所述查询的查询参数和查询范围(904),所述查询范围包括位于至少两个不同类型的内容服务器上的内容源,
从所述至少两个内容服务器中每一个基于所述查询参数所执行的搜索中接收查询统计数据(908),
聚集来自所述至少两个内容服务器的所述查询统计数据并将已聚集的查询统计数据呈现在用户界面中(910),其中示出关于所述多个内容源中每一个的所述查询统计数据,
从所述至少两个内容服务器中检索与匹配于所述查询的内容项有关的数据(912),以及
根据所检索的数据,在所述用户界面中呈现对匹配于所述查询的内容项的预览(914)。
CN2012104523061A 2011-11-14 2012-11-13 跨多个不同的内容源来定位相关内容项 Pending CN102999574A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/295,108 2011-11-14
US13/295,108 US9817898B2 (en) 2011-11-14 2011-11-14 Locating relevant content items across multiple disparate content sources

Publications (1)

Publication Number Publication Date
CN102999574A true CN102999574A (zh) 2013-03-27

Family

ID=47928142

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012104523061A Pending CN102999574A (zh) 2011-11-14 2012-11-13 跨多个不同的内容源来定位相关内容项

Country Status (4)

Country Link
US (2) US9817898B2 (zh)
EP (1) EP2780838B1 (zh)
CN (1) CN102999574A (zh)
WO (1) WO2013074378A2 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105393266A (zh) * 2013-06-24 2016-03-09 微软技术许可有限责任公司 将来自不同内容源的内容聚集在云服务处
CN106233740A (zh) * 2013-11-13 2016-12-14 谷歌公司 用于呈现推荐媒体内容项的方法、系统和介质
CN107196919A (zh) * 2017-04-27 2017-09-22 北京小米移动软件有限公司 一种匹配数据的方法和装置
CN110291515A (zh) * 2017-02-13 2019-09-27 微软技术许可有限责任公司 计算系统中的分布式索引搜索
CN110520848A (zh) * 2017-04-19 2019-11-29 微软技术许可有限责任公司 在异构选项卡环境中浮现与任务相关的应用
US10880613B2 (en) 2013-11-12 2020-12-29 Google Llc Methods, systems, and media for presenting suggestions of media content

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7933859B1 (en) 2010-05-25 2011-04-26 Recommind, Inc. Systems and methods for predictive coding
US9817898B2 (en) * 2011-11-14 2017-11-14 Microsoft Technology Licensing, Llc Locating relevant content items across multiple disparate content sources
JP2014170491A (ja) * 2013-03-05 2014-09-18 Fuji Xerox Co Ltd 中継装置、システム及びプログラム
JP5966974B2 (ja) * 2013-03-05 2016-08-10 富士ゼロックス株式会社 中継装置、クライアント装置、システム及びプログラム
US10949459B2 (en) * 2013-06-13 2021-03-16 John F. Groom Alternative search methodology
US9336332B2 (en) * 2013-08-28 2016-05-10 Clipcard Inc. Programmatic data discovery platforms for computing applications
US9846718B1 (en) * 2014-03-31 2017-12-19 EMC IP Holding Company LLC Deduplicating sets of data blocks
US10229208B2 (en) * 2014-07-28 2019-03-12 Facebook, Inc. Optimization of query execution
US10096074B2 (en) 2014-12-23 2018-10-09 Veritas Technologies Llc Systems and methods for expanding relevant search results in electronic discovery
US10430454B2 (en) * 2014-12-23 2019-10-01 Veritas Technologies Llc Systems and methods for culling search results in electronic discovery
US10055301B2 (en) * 2015-06-15 2018-08-21 Open Text Sa Ulc Systems and methods for content server make disk image operation
CA3033108A1 (en) * 2016-08-09 2018-02-15 Michael MOSKWINSKI Systems and methods for contextual retrieval of electronic records
US11232068B2 (en) 2017-03-27 2022-01-25 Microsoft Technology Licensing, Llc Unified document retention management system
US10503908B1 (en) * 2017-04-04 2019-12-10 Kenna Security, Inc. Vulnerability assessment based on machine inference
US10902066B2 (en) 2018-07-23 2021-01-26 Open Text Holdings, Inc. Electronic discovery using predictive filtering
US11294925B2 (en) * 2018-09-24 2022-04-05 Jpmorgan Chase Bank, N.A. Methods for implementing and using a database actuator
US11366814B2 (en) 2019-06-12 2022-06-21 Elsevier, Inc. Systems and methods for federated search with dynamic selection and distributed relevance
CN113779374B (zh) * 2021-02-24 2023-09-26 北京京东振世信息技术有限公司 一种页面查询管理方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1374606A (zh) * 2001-03-06 2002-10-16 时睿软件公司 通过计算机网络从数据库获取和集成数据的方法及系统
CN1511283A (zh) * 2001-03-01 2004-07-07 �Ҵ���˾ 用于连接不同对象类型的服务器和客户机的方法和网桥
US20090150168A1 (en) * 2007-12-07 2009-06-11 Sap Ag Litigation document management
US20100017366A1 (en) * 2008-07-18 2010-01-21 Robertson Steven L System and Method for Performing Contextual Searches Across Content Sources
US20110082848A1 (en) * 2009-10-05 2011-04-07 Lev Goldentouch Systems, methods and computer program products for search results management
WO2011128945A1 (en) * 2010-04-16 2011-10-20 Hitachi, Ltd. Integrated search server and integrated search method

Family Cites Families (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5826260A (en) 1995-12-11 1998-10-20 International Business Machines Corporation Information retrieval system and method for displaying and ordering information based on query element contribution
US6122666A (en) 1998-02-23 2000-09-19 International Business Machines Corporation Method for collaborative transformation and caching of web objects in a proxy network
US6643694B1 (en) 2000-02-09 2003-11-04 Michael A. Chernin System and method for integrating a proxy server, an e-mail server, and a DHCP server, with a graphic interface
US6738760B1 (en) 2000-03-23 2004-05-18 Albert Krachman Method and system for providing electronic discovery on computer databases and archives using artificial intelligence to recover legally relevant data
IL152480A0 (en) 2000-04-27 2003-05-29 Webfeat Inc Method and system for retrieving search results from multiple disparate databases
US7451136B2 (en) 2000-10-11 2008-11-11 Microsoft Corporation System and method for searching multiple disparate search engines
US7043489B1 (en) 2001-02-23 2006-05-09 Kelley Hubert C Litigation-related document repository
US6745197B2 (en) 2001-03-19 2004-06-01 Preston Gates Ellis Llp System and method for efficiently processing messages stored in multiple message stores
US20030217062A1 (en) 2001-12-18 2003-11-20 Shawn Thomas Method and system for asset transition project management
US20030131241A1 (en) 2002-01-04 2003-07-10 Gladney Henry M. Trustworthy digital document interchange and preservation
US20030130953A1 (en) 2002-01-09 2003-07-10 Innerpresence Networks, Inc. Systems and methods for monitoring the presence of assets within a system and enforcing policies governing assets
ITMO20020006A1 (it) 2002-01-10 2003-07-10 Dream Team Srl Metodo e sistema per l'identificazione di utenti e l'autenticazione di documenti digitali su reti telematiche
WO2003079191A1 (en) 2002-03-11 2003-09-25 Visionshare, Inc. Method and system for peer-to-peer secure communication
US20040167979A1 (en) 2003-02-20 2004-08-26 International Business Machines Corporation Automatic configuration of metric components in a service level management system
US7162473B2 (en) 2003-06-26 2007-01-09 Microsoft Corporation Method and system for usage analyzer that determines user accessed sources, indexes data subsets, and associated metadata, processing implicit queries based on potential interest to users
EP1494394A1 (en) 2003-06-30 2005-01-05 Sony International (Europe) GmbH Distance-aware service mechanism for determining the availability of remote services in wireless personal area networks
US7523220B2 (en) 2003-09-17 2009-04-21 Microsoft Corporation Metaspace: communication middleware for partially connected mobile ad hoc networks
US20050149496A1 (en) 2003-12-22 2005-07-07 Verity, Inc. System and method for dynamic context-sensitive federated search of multiple information repositories
US7437353B2 (en) 2003-12-31 2008-10-14 Google Inc. Systems and methods for unification of search results
US7376644B2 (en) 2004-02-02 2008-05-20 Ram Consulting Inc. Knowledge portal for accessing, analyzing and standardizing data
US20060048216A1 (en) 2004-07-21 2006-03-02 International Business Machines Corporation Method and system for enabling federated user lifecycle management
US7734606B2 (en) 2004-09-15 2010-06-08 Graematter, Inc. System and method for regulatory intelligence
US20080077570A1 (en) 2004-10-25 2008-03-27 Infovell, Inc. Full Text Query and Search Systems and Method of Use
US7984057B2 (en) 2005-05-10 2011-07-19 Microsoft Corporation Query composition incorporating by reference a query definition
US7984039B2 (en) 2005-07-14 2011-07-19 International Business Machines Corporation Merging of results in distributed information retrieval
US20070050431A1 (en) 2005-08-26 2007-03-01 Microsoft Corporation Deploying content between networks
US20070073638A1 (en) 2005-09-26 2007-03-29 Bea Systems, Inc. System and method for using soft links to managed content
WO2007044709A2 (en) 2005-10-06 2007-04-19 Guidance Software, Inc. Electronic discovery system and method
US20070118529A1 (en) 2005-11-18 2007-05-24 Howell James A Jr Content download experience
US7752204B2 (en) 2005-11-18 2010-07-06 The Boeing Company Query-based text summarization
US8386469B2 (en) 2006-02-16 2013-02-26 Mobile Content Networks, Inc. Method and system for determining relevant sources, querying and merging results from multiple content sources
US8214394B2 (en) 2006-03-01 2012-07-03 Oracle International Corporation Propagating user identities in a secure federated search system
JP2009541839A (ja) 2006-06-23 2009-11-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ デジタルコンテンツメタデータの表現
ATE471025T1 (de) 2006-09-13 2010-06-15 Alcatel Lucent Verkettung von web services
CN101529419B (zh) 2006-10-17 2013-05-01 慷孚系统公司 用于对内容进行离线索引和对存储的数据进行分类的方法和系统
JP4940898B2 (ja) 2006-11-02 2012-05-30 富士通株式会社 デジタルコンテンツ検索プログラム、デジタルコンテンツ検索装置およびデジタルコンテンツ検索方法
US7866543B2 (en) 2006-11-21 2011-01-11 International Business Machines Corporation Security and privacy enforcement for discovery services in a network of electronic product code information repositories
JP5379696B2 (ja) 2006-12-29 2013-12-25 トムソン ルーターズ グローバル リソーシーズ 概念ベースの検索とランク付けを伴う情報検索のシステム、方法およびソフトウェア
US20080222296A1 (en) 2007-03-07 2008-09-11 Lisa Ellen Lippincott Distributed server architecture
US20080228700A1 (en) 2007-03-16 2008-09-18 Expanse Networks, Inc. Attribute Combination Discovery
US20080288509A1 (en) 2007-05-16 2008-11-20 Google Inc. Duplicate content search
US7904470B2 (en) 2007-06-13 2011-03-08 Sap Ag Discovery service for electronic data environment
US20110047189A1 (en) 2007-10-01 2011-02-24 Microsoft Corporation Integrated Genomic System
US8396838B2 (en) 2007-10-17 2013-03-12 Commvault Systems, Inc. Legal compliance, electronic discovery and electronic document handling of online and offline copies of data
US8145684B2 (en) 2007-11-28 2012-03-27 International Business Machines Corporation System and computer program product for assembly of personalized enterprise information integrators over conjunctive queries
US8276152B2 (en) 2007-12-05 2012-09-25 Microsoft Corporation Validation of the change orders to an I T environment
US20090150906A1 (en) 2007-12-07 2009-06-11 Sap Ag Automatic electronic discovery of heterogeneous objects for litigation
CN101187888A (zh) 2007-12-11 2008-05-28 浪潮电子信息产业股份有限公司 一种异构环境中复制数据库数据的方法
US8572043B2 (en) 2007-12-20 2013-10-29 International Business Machines Corporation Method and system for storage of unstructured data for electronic discovery in external data stores
US9411861B2 (en) 2007-12-21 2016-08-09 International Business Machines Corporation Multiple result sets generated from single pass through a dataspace
US8140494B2 (en) 2008-01-21 2012-03-20 International Business Machines Corporation Providing collection transparency information to an end user to achieve a guaranteed quality document search and production in electronic data discovery
US8055665B2 (en) 2008-03-13 2011-11-08 International Business Machines Corporation Sorted search in a distributed directory environment using a proxy server
TWI476610B (zh) 2008-04-29 2015-03-11 Maxiscale Inc 同級間冗餘檔案伺服器系統及方法
US7930306B2 (en) 2008-04-30 2011-04-19 Msc Intellectual Properties B.V. System and method for near and exact de-duplication of documents
US20100235354A1 (en) 2009-03-12 2010-09-16 International Business Machines Corporation Collaborative search engine system
US8239399B2 (en) * 2009-05-14 2012-08-07 Microsoft Corporation Providing tools for navigational search query results
CN101576977A (zh) 2009-06-01 2009-11-11 中国政法大学 证据管理系统
US8200642B2 (en) 2009-06-23 2012-06-12 Maze Gary R System and method for managing electronic documents in a litigation context
RU2420800C2 (ru) 2009-06-30 2011-06-10 Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) Способ поиска похожих по смысловому содержимому электронных документов, размещенных на устройствах хранения данных
US8849955B2 (en) 2009-06-30 2014-09-30 Commvault Systems, Inc. Cloud storage and networking agents, including agents for utilizing multiple, different cloud storage sites
US20110047166A1 (en) 2009-08-20 2011-02-24 Innography, Inc. System and methods of relating trademarks and patent documents
CN101789021A (zh) 2010-02-24 2010-07-28 浪潮通信信息系统有限公司 一种通用可配置的数据库数据迁移方法
US20110218973A1 (en) 2010-03-02 2011-09-08 Renew Data Corp. System and method for creating a de-duplicated data set and preserving metadata for processing the de-duplicated data set
US9361350B2 (en) 2010-03-26 2016-06-07 Salesforce.Com, Inc. Data transfer between first and second databases
CN101819592A (zh) 2010-04-19 2010-09-01 山东高效能服务器和存储研究院 一种通用的跨操作系统的海量历史数据处理方法
US20110320494A1 (en) 2010-06-28 2011-12-29 Martin Fisher Litigation document management linking unstructured documents with business objects
KR101064981B1 (ko) 2010-10-07 2011-09-15 한국과학기술정보연구원 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치 및 방법
US8515962B2 (en) 2011-03-30 2013-08-20 Sap Ag Phased importing of objects
US9817898B2 (en) * 2011-11-14 2017-11-14 Microsoft Technology Licensing, Llc Locating relevant content items across multiple disparate content sources

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1511283A (zh) * 2001-03-01 2004-07-07 �Ҵ���˾ 用于连接不同对象类型的服务器和客户机的方法和网桥
CN1374606A (zh) * 2001-03-06 2002-10-16 时睿软件公司 通过计算机网络从数据库获取和集成数据的方法及系统
US20090150168A1 (en) * 2007-12-07 2009-06-11 Sap Ag Litigation document management
US20100017366A1 (en) * 2008-07-18 2010-01-21 Robertson Steven L System and Method for Performing Contextual Searches Across Content Sources
US20110082848A1 (en) * 2009-10-05 2011-04-07 Lev Goldentouch Systems, methods and computer program products for search results management
WO2011128945A1 (en) * 2010-04-16 2011-10-20 Hitachi, Ltd. Integrated search server and integrated search method

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105393266B (zh) * 2013-06-24 2019-12-03 微软技术许可有限责任公司 将来自不同内容源的内容聚集在云服务处
CN105393266A (zh) * 2013-06-24 2016-03-09 微软技术许可有限责任公司 将来自不同内容源的内容聚集在云服务处
US10536504B2 (en) 2013-06-24 2020-01-14 Microsoft Technology Licensing, Llc Aggregating content from different content sources at a cloud service
US11381880B2 (en) 2013-11-12 2022-07-05 Google Llc Methods, systems, and media for presenting suggestions of media content
US10880613B2 (en) 2013-11-12 2020-12-29 Google Llc Methods, systems, and media for presenting suggestions of media content
CN106233740B (zh) * 2013-11-13 2019-06-11 谷歌有限责任公司 用于呈现推荐媒体内容项的方法、系统和介质
US11023542B2 (en) 2013-11-13 2021-06-01 Google Llc Methods, systems, and media for presenting recommended media content items
CN106233740A (zh) * 2013-11-13 2016-12-14 谷歌公司 用于呈现推荐媒体内容项的方法、系统和介质
CN110291515A (zh) * 2017-02-13 2019-09-27 微软技术许可有限责任公司 计算系统中的分布式索引搜索
CN110291515B (zh) * 2017-02-13 2023-08-15 微软技术许可有限责任公司 计算系统中的分布式索引搜索
CN110520848A (zh) * 2017-04-19 2019-11-29 微软技术许可有限责任公司 在异构选项卡环境中浮现与任务相关的应用
CN110520848B (zh) * 2017-04-19 2023-09-12 微软技术许可有限责任公司 在异构选项卡环境中浮现与任务相关的应用
CN107196919A (zh) * 2017-04-27 2017-09-22 北京小米移动软件有限公司 一种匹配数据的方法和装置
CN107196919B (zh) * 2017-04-27 2021-01-01 北京小米移动软件有限公司 一种匹配数据的方法和装置

Also Published As

Publication number Publication date
US20170032039A1 (en) 2017-02-02
WO2013074378A2 (en) 2013-05-23
EP2780838A4 (en) 2015-10-14
US20130124552A1 (en) 2013-05-16
US9996618B2 (en) 2018-06-12
EP2780838B1 (en) 2019-08-07
EP2780838A2 (en) 2014-09-24
US9817898B2 (en) 2017-11-14
WO2013074378A3 (en) 2013-07-18

Similar Documents

Publication Publication Date Title
CN102999574A (zh) 跨多个不同的内容源来定位相关内容项
US11372660B2 (en) Framework for custom actions on an information feed
US9807187B2 (en) Business networking information feed alerts
US11038973B2 (en) Contact event feeds and activity updates
US9529864B2 (en) Data mining electronic communications
US9037579B2 (en) Generating dynamic hierarchical facets from business intelligence artifacts
US9594759B2 (en) Backup and archival of selected items as a composite object
US8977623B2 (en) Method and system for search engine indexing and searching using the index
US8775426B2 (en) Interface to navigate and search a concept hierarchy
US20150178858A1 (en) Structured data in a business networking feed
CN102930035A (zh) 从多个不同的内容源导出内容项
US20120102420A1 (en) Multiple Views in an Information Feed
AU2014318151B2 (en) Smart search refinement
CN106911757A (zh) 一种业务信息的推送方法和装置
US8560520B2 (en) Information retrieval using time
CA2832918C (en) Systems and methods for ranking document clusters
US8250024B2 (en) Search relevance in business intelligence systems through networked ranking
CN109074399B (zh) 计算机网络中的个性化内容建议
Uludag analysis of the ELK stack applicability for Big Data use cases

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150729

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20150729

Address after: Washington State

Applicant after: Micro soft technique license Co., Ltd

Address before: Washington State

Applicant before: Microsoft Corp.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130327