WO2017179778A1 - Search method and apparatus using big data - Google Patents

Search method and apparatus using big data Download PDF

Info

Publication number
WO2017179778A1
WO2017179778A1 PCT/KR2016/010324 KR2016010324W WO2017179778A1 WO 2017179778 A1 WO2017179778 A1 WO 2017179778A1 KR 2016010324 W KR2016010324 W KR 2016010324W WO 2017179778 A1 WO2017179778 A1 WO 2017179778A1
Authority
WO
WIPO (PCT)
Prior art keywords
search
keyword
big data
words
electronic terminal
Prior art date
Application number
PCT/KR2016/010324
Other languages
French (fr)
Korean (ko)
Inventor
김인중
Original Assignee
(주)솔루젠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)솔루젠 filed Critical (주)솔루젠
Publication of WO2017179778A1 publication Critical patent/WO2017179778A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2219Large Object storage; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • G06Q50/40

Definitions

  • the present invention relates to a search method and apparatus using big data.
  • a content search engine system can quickly search for and provide accurate information corresponding to a user query in a plurality of databases in which a large amount of data is recorded. It is expected to be used in various fields such as intelligent robots, next generation PCs, telematics and home networks.
  • the existing Internet keyword search for example, by searching the data stored in the relevant server of the portal site or data on the Internet to find and present (or highly relevant) data containing the keyword.
  • the materials presented are usually web pages, picture files, and video files. Except for pictures and videos, in most cases, links to homepages with text data are often found.
  • the top search item (homepage link) in the search may or may not be representative of 'Hong Gil-dong'. In other words, it is only the most recent post, so it may appear at the top, and even if it is not a topic, it has been exposed to the top. This is a phenomenon that occurs because the existing search judges only that the search keyword is included and does not consider the contents of the search result at all.
  • a method for searching a keyword using big data through an electronic terminal comprising: setting a big data database to be searched in the electronic terminal; Receiving a search keyword through an input unit of the electronic terminal; Selecting, by the electronic terminal, a material including the search keyword among respective materials included in the big data database; Counting, by the electronic terminal, the number of words or phrases included in the selected data; Ranking, by the electronic terminal, the counted word or phrase in order of appearance frequency; Selecting, by the electronic terminal, the plurality of ranked words or phrases as a plurality of related search words; And visually displaying the selected plurality of related search words on a display of the electronic terminal.
  • the displaying may be performed in larger letters as a related search word having a higher ranking.
  • the displaying may be performed in a larger circle or a larger polygon box with a higher ranking search term.
  • the displaying may be performed by changing the color of the text according to the ranking, or writing the letters of some ranks horizontally and writing the letters of the other ranks vertically.
  • the big data database is an SNS article.
  • a specific company or business is evaluated by the keyword search.
  • an electronic device for searching a keyword using big data comprising: a setting unit for setting a big data database to be searched for; An input unit to receive a search keyword; Control unit; And a display, wherein the controller is configured to select a material including the search keyword among respective materials included in the big data database, count the number of words or phrases included in the selected data, and The counted words or phrases are ranked in order of appearance frequency, the plurality of ranked words or phrases are selected as a plurality of related search terms, and the display is controlled to visually display the selected plurality of related search terms.
  • a keyword retrieval electronic device is provided.
  • the display control of the control unit displays the related search word having a higher ranking in larger letters.
  • the display control of the control unit displays the higher-ranked related search word in a larger circle or a larger polygon box.
  • the display control of the control unit is arranged to change the color of the text according to the ranking, or to write the letters of some ranks and to write the letters of some other ranks vertically.
  • the big data database is an SNS article.
  • the keyword search evaluates a particular company or business.
  • the related search word is a vocabulary that is used most frequently with the search keyword, it provides a very accurate result for the search keyword.
  • the first related search word is displayed in the largest font
  • the second related search word is displayed in the next large font
  • the third association is used.
  • the search term can then be differentiated by displaying the next larger letter (ie, a smaller letter than the second associated search term).
  • Other visual arrangements are also acceptable.
  • FIG. 1 is a diagram visually showing an example of a search result according to the present invention.
  • FIG. 2 shows an example of a flow diagram of a search according to the present invention.
  • Figure 3 shows the flow of the search according to the present invention divided into four stages.
  • 4 to 6 are examples of making a search according to the present invention in the form of a smartphone app, and show a process of inputting a user request association word mentioned in FIG. 3.
  • 7 to 8 are examples of making a search according to the present invention in the form of a smartphone app, and show a process of 'real time data collection' mentioned in FIG. 3.
  • 9 to 10 are examples of making a search according to the present invention in the form of a smartphone app, and show the 'data analysis' process mentioned in FIG. 3.
  • FIG. 11 is an example of making a search according to the present invention in the form of a smartphone app, and illustrates the process of 'visualization' referred to in FIG. 3.
  • FIG. 12 is a diagram illustrating collection of portal issue word association words.
  • FIG 13 shows an example of an apparatus according to the invention.
  • a method for searching a keyword using big data through an electronic terminal comprising: setting a big data database to be searched in the electronic terminal; Receiving a search keyword through an input unit of the electronic terminal; Selecting, by the electronic terminal, a material including the search keyword among respective materials included in the big data database; Counting, by the electronic terminal, the number of words or phrases included in the selected data; Ranking, by the electronic terminal, the counted word or phrase in order of appearance frequency; Selecting, by the electronic terminal, the plurality of ranked words or phrases as a plurality of related search words; And visually displaying the selected plurality of related search words on a display of the electronic terminal.
  • the displaying may be performed in larger letters as a related search word having a higher ranking.
  • the displaying may be performed in a larger circle or a larger polygon box with a higher ranking search term.
  • the displaying may be performed by changing the color of the text according to the ranking, or writing the letters of some ranks horizontally and writing the letters of the other ranks vertically.
  • the big data database is an SNS article.
  • a specific company or business is evaluated by the keyword search.
  • an electronic device for searching a keyword using big data comprising: a setting unit for setting a big data database to be searched for; An input unit to receive a search keyword; Control unit; And a display, wherein the controller is configured to select a material including the search keyword among respective materials included in the big data database, count the number of words or phrases included in the selected data, and The counted words or phrases are ranked in order of appearance frequency, the plurality of ranked words or phrases are selected as a plurality of related search terms, and the display is controlled to visually display the selected plurality of related search terms.
  • a keyword retrieval electronic device is provided.
  • the display control of the control unit displays the related search word having a higher ranking in larger letters.
  • the display control of the control unit displays the higher-ranked related search word in a larger circle or a larger polygon box.
  • the display control of the control unit is arranged to change the color of the text according to the ranking, or to write the letters of some ranks and to write the letters of some other ranks vertically.
  • the big data database is an SNS article.
  • the keyword search evaluates a particular company or business.
  • FIG. 1 is a diagram visually showing an example of a search result according to the present invention.
  • Existing Internet keyword searches for example, search for data stored in relevant servers of portal sites or data on the Internet to find and present (or highly relevant) material containing the keyword.
  • the materials presented are usually web pages, picture files, and video files. Except for pictures and videos, in most cases, links to homepages with text data are often found.
  • big data is used as a database, and the search results are not simply displayed in letters, but the related keywords are displayed by differentially increasing the size of the letters so as to be intuitively recognized.
  • the search database differs from the conventional one as big data.
  • the web page is not searched, but is shown at the top based on the number of times mentioned in big data such as SNS. Show at the top is also possible to show at the top of the search results, but more preferably to show the largest of the most mentioned.
  • a specific candidate name (Hong Gil-dong) is searched according to the present invention
  • various keywords may appear, but for example, Hong Gil-dong has been exposed to the press for military service corruption, and so on SNS, he has been mentioned much about the military corruption of candidates.
  • the search keyword "Hong Gil-dong” the method and apparatus of the present invention may refer to the first related keyword (i.e., "military corruption" most frequently mentioned for candidate Hong Gil-dong on SNS as the related keyword (ie, the search result).
  • the keyword 'Hong Gil-dong' and the keyword most frequently mentioned together in the SNS article can be selected.
  • 'commit' may be selected as the second related keyword.
  • the keywords most frequently used in big data such as SNS articles are ranked.
  • the search target is not limited to a post stored in a specific server such as a portal site such as Naver, but big data, and thus the accuracy of the search can be expected to be quite high.
  • the criterion for selecting the related keyword may be, for example, limited to only the keyword mentioned together with the search keyword more than a thousand times and ranked among them.
  • Searches on existing portal sites may only target data pre-collected by the portal site (e.g. Naver, Daum), or may search the entire Internet, even if not previously collected (e.g., Google).
  • the present invention can also target the general Internet as a search target, it is preferable to target only the big data, among others.
  • Big data refers to SNS articles such as Twitter and Facebook as an example.
  • a search may be performed including the entire Internet data (for example, Internet press articles, blog posts, etc.).
  • the difference from the existing search is that it does not search for specific material related to the search keyword (ie, specific press article, specific blog post, specific image, specific video, etc.), but searches the entire big data. It finds the frequency of other related keywords that appear with the keyword (that is, in the same paragraph or in the same article), ranks them, and displays the ranking.
  • the top search item (homepage link) in the search may or may not be representative of 'Hong Gil-dong'. In other words, it is only the most recent post, so it may appear at the top, and even if it is not a topic, it has been exposed to the top. This phenomenon occurs because the existing search judges only that the search keyword is included and does not consider the contents of the search result at all.
  • the first related search word is a vocabulary that is used most frequently with the search keyword, it provides a very accurate result for the search keyword.
  • the first related search word is displayed in the largest font
  • the second related search word is displayed in the next large font
  • the third association is used.
  • the search term can then be differentiated by displaying the next larger letter (ie, a smaller letter than the second associated search term).
  • the first related search word does not necessarily need to be at the top, but may appear in the center of the search terminal screen, or may be displayed in other positions. Since the font size is the largest, it can be easily understood that the first related search word is displayed anywhere on the screen.
  • the font size may also indicate the degree of relevance ranking, or the degree of relevance ranking may be indicated by the size of the circle so as to put the first related search term in the largest circle and the second related search term in the next large circle.
  • the position of the circle can also be displayed at the top of the largest and gradually smaller toward the bottom, the largest can be displayed at the leftmost and gradually smaller toward the right, or randomly displayed on the screen and the size can be viewed by the user. You can make a judgment.
  • the text does not necessarily need to be written horizontally, and some related search words may be written horizontally and some related search words may be written vertically so that they can be visually and intuitively understood.
  • the color may be changed for each related search word.
  • the first related search term is "military corruption” and the second related search term is "commitment” using "Hong Gil-dong” as the search keyword, "commitment” is the largest letter on the search result screen, and then “commitment” is next.
  • the large text and the rest of the related search terms will be listed in the appropriate font size for each ranking.
  • Each related search term can be configured to be clickable, and when a specific related search term (eg, "commitment”) is clicked, a specific article about which "Hong Gil-dong" and “commitment” are mentioned together can be viewed. It is.
  • the specific writing is a writing that constitutes a part of the big data, and may be a normal SNS writing, but may be searched to include a writing of a normal internet site (eg, an internet press or a blog) as necessary.
  • the most related word (first related search word) for the search term 'tuya' is “Kim Ji-hye” and is indicated in large letters in the center of FIG. 1.
  • the next most relevant word (second related search term) is "Sugar Man”, which is indicated in large letters at the bottom slightly in the middle of FIG.
  • the next most related word (third related search term) is "eye glasses”, which are indicated in a slightly smaller font at the top slightly in the middle of FIG. It can be seen that other related search terms (ie, below the fourth related search term) are displayed in a form enclosing the letter "Kim Ji-hye" in the center.
  • the general service version may provide only related search terms, and the paid service version may be configured so that a specific article (which phrase comes from) may be clicked on.
  • Big data may be provided through, for example, an association / agreement with a company such as Teradata. This linkage will enable individuals to see the big data of public services.
  • a search for a specific restaurant name may be assumed.
  • a related search term "weave” may come out, and a related search term "delicious” may come out. Both of them appear a lot, but the most relevant search term is "weave”. That is, when a specific restaurant name is searched, if the first related search term is "weave” and the second related search term is "delicious," the user of the present invention may cook the salty food while the specific restaurant is delicious, but is generally cooked. Can be obtained.
  • the existing search there is no choice but to read the reviews of the restaurant that stands at the top. This is a time consuming task and the review is not necessarily fair.
  • the graphic in the present invention for example, by varying the size of the circle to indicate the size of the degree of association, or to provide a variety of visual and intuitive interface through horizontal writing, vertical writing, color mixing, etc. You can get easy and accurate information.
  • the contents must be checked by reading the article with the human eye through the keyword search, and eventually, a large amount of human power is required.
  • the machine since the machine filters the most frequently read letters by reading, the human power is not necessary. And, if a large number of searches are displayed in large letters, it is very easy to grasp the degree of association, and discrimination is given. Not only large letters but also highlights, color differences, or any other visual effects may be given or combined.
  • Big data according to the present invention can be variously diversified, such as articles, blogs, SNS, Twitter. Some or all of these can be used and can be applied to new, separate database systems as needed.
  • the analysis for searching (selecting related search terms) of the present invention may use techniques such as machine learing and deep learning as a big data analysis technique.
  • the method and apparatus of the present invention are based on the web, Or it may be implemented based on the app (application) of the smartphone.
  • Re-search means that when “Hong Gil-dong” is searched and “military corruption” is the first related search word, when “military corruption” is clicked, “military corruption” now becomes a search keyword and searches for the related search word accordingly.
  • the term 'associated search term' itself may be a somewhat broad term, but it should not be understood simply by the meaning of the word, but the preconditions of the present invention as described above, that is, the form of the show, the form of the app, the search Since the term refers to a related search word within a condition that conditions, such as object or method, are satisfied, the term is not judged solely.
  • a search term "Hong Gil-dong" if a search term "Hong Gil-dong" is put in, a quiz play for predicting what the first related search term may appear may be played. Or you can play a quiz that predicts when a search term will appear "military irregularities" when you enter. It may also function as a simple and fun play among young people.
  • the central keyword may be selected according to the frequency of occurrence of the word.
  • the central keyword may be regarded as the same concept as the aforementioned related search word.
  • the present invention is not limited thereto, and may provide discrimination in various visual forms.
  • the word count (ie association checking) process may use various algorithms and weighting methods. If some data in the big data is determined to be a commercial article, the article may be excluded from the word count. Determination of the commerciality may be possible by various means, for example, by checking whether the text of the material contains a predetermined (predetermined) propaganda text, or by checking whether a specific homepage address is included. .
  • FIG. 2 shows an example of a flow diagram of a search according to the present invention.
  • the present invention provides a method and apparatus for searching for keywords using big data through an electronic terminal.
  • an electronic terminal sets a big data database to be searched for (step 201). Then, the search keyword is input through the input unit of the electronic terminal (step 202).
  • the electronic terminal selects the data including the search keyword from among the materials included in the big data database (step 203).
  • the electronic terminal counts the number of words or phrases included in the selected data (step 204). Then, the electronic terminal ranks the counted words or phrases in order of appearance frequency (step 205).
  • the electronic terminal selects a plurality of ranked words or phrases as a plurality of related search terms (step 206).
  • the selected plurality of related search words are visually displayed on the display of the electronic terminal (step 207).
  • the present invention may operate in a PC connected to a big data database and a network, or may operate in a device such as a smartphone.
  • Figure 3 shows the flow of the search according to the present invention divided into four stages.
  • the present invention can be viewed as being largely passed through a 'user request association word input' process, a 'real time data collection' process, a 'data analysis' process, and a 'visualization' process.
  • 4 to 6 are examples of making a search according to the present invention in the form of a smartphone app, and show a process of inputting a user request association word mentioned in FIG. 3.
  • a search box (input box) is displayed, and in the lower part, 20 real-time search words that are an issue in a portal site (eg, Naver, Daum, etc.) are displayed by rank.
  • a portal site eg, Naver, Daum, etc.
  • the main page of the app according to the present invention is written in HTML format for the purpose of a web app.
  • the user can receive a word that he / she wants to find, and the user can click the enter key or the analysis button below to transfer the input content to the internal collection program.
  • the top 20 list windows of real-time search terms of portal sites are arranged at the lower part separately from the user input part of the upper part of the page. It automatically collects real-time search term ranking, collects and analyzes web data related to the word, and places it on the main screen where the user accesses to add additional value for user convenience.
  • the user request association word function (ie, a function related to the input window in the upper part of FIG. 3) provides a function of allowing a user to enter at least one to many desired words by accessing the main page of the app according to the present invention. .
  • text can be received as an input value, and multiple words can be passed as input values separated by spaces. If you press the Analyze button or click Enter without entering a word, you are prompted to enter a word. This may be implemented through, for example, the code shown in FIG. 5.
  • search.jsp passes the passed argument values back to the data collection program. This may be implemented, for example, through the code shown in FIG. 6.
  • 7 to 8 are examples of making a search according to the present invention in the form of a smartphone app, and show a process of 'real time data collection' mentioned in FIG. 3.
  • Collecting real-time data on the Internet runs a web scraping engine, searches for documents containing the words entered by the user, and stores the results in html or plain text.
  • the search result uses the word entered by the user as the file name. This may be implemented through, for example, the code shown in FIG. 7.
  • the initial data collected through the web scraping engine contains html tags and unnecessary characters that cannot be analyzed immediately, so data filtering is performed to clean up these unnecessary contents. Once the filtering is done, the file will be in the form of a plain text file. This may be implemented through, for example, the code shown in FIG. 8.
  • the present invention collects data from various sources such as web, SNS, blog, and the like to find a related word of a user request (that is, a word entered in the input window of FIG. 4), or a portal.
  • An association word of an issue word ie, words marked as issues 1 to 10 and issues 11 to 20 at the bottom of FIG. 4 may be collected.
  • 9 to 10 are examples of making a search according to the present invention in the form of a smartphone app, and show the 'data analysis' process mentioned in FIG. 3.
  • Data analysis enables Korean parsing using KoNLP package of open software R. It takes a text file that has been filtered and deletes unnecessary symbols that could not be removed by the filtering program. This may be implemented through, for example, the code shown in FIG. 9.
  • FIG. 11 is an example of making a search according to the present invention in the form of a smartphone app, and illustrates the process of 'visualization' referred to in FIG. 3.
  • the visualization uses R's word cloud package to output in png file format.
  • the word cloud places the word with the highest frequency in the center and outputs the word with the smaller frequency. The more output the parameters are, the closer they are to the prototype. This may be implemented through, for example, the code shown in FIG. 11.
  • the result of completing the visualization is transferred to the first requested user screen.
  • the result delivered includes the resulting png file and a list of the top 10 words.
  • the search.jsp file creates the received png file name and word list in html format and delivers it to the user's screen.
  • the top ten words of the analysis result are linked to the search box of the portal site (eg, Naver) for the user's re-search convenience.
  • the list of the predetermined number of issue words (eg, 20) displayed on the main screen is an example every 5 minutes. Every time the portal automatically connects to the word list has been collected. In order to maintain the real-time information of the information provided, the same word is newly collected every two hours.
  • the collected list is delivered to the web scrap program and the analysis result is stored in the server and provided to the user. This may be implemented through, for example, the code shown in FIG. 12.
  • FIG 13 shows an example of an apparatus according to the invention.
  • the apparatus includes a setting unit 301 for setting a big data database to be searched, an input unit 303 for receiving a search keyword, a controller 305 and a display 307.
  • the controller 305 selects a material including a search keyword from among materials included in the big data database, counts the number of words or phrases included in the selected data, and counts the counted words or phrases.
  • the ranking may be performed in order, a plurality of ranked words or phrases may be selected as a plurality of related search terms, and the display 307 may be controlled to visually display the selected plurality of related search terms.
  • the controller 305 may be, for example, a CPU of a PC or a CPU of a smartphone.
  • the present invention relates to a search method and apparatus using big data, and has industrial applicability.

Abstract

Provided are a method and an apparatus for searching for a keyword through an electronic terminal by using big data. A big data database to be searched is set in the electronic terminal. A search keyword is received through an input unit of the electronic terminal. The electronic terminal selects a document including the search keyword from among documents included in the big data database. The electronic terminal counts the number of words or phrases included in the selected document. The electronic terminal ranks the counted words or phrases in order of appearance frequency. The electronic terminal selects a plurality of ranked words or phrases as a plurality of related search words. The selected plurality of related search words are visually displayed on a display of the electronic terminal.

Description

빅데이터를 이용한 검색 방법 및 장치Search method and device using big data
본 발명은 빅데이터를 이용한 검색 방법 및 장치에 관한 것이다.The present invention relates to a search method and apparatus using big data.
최근 정보 처리 기술이 급속하게 발달하여 스마트폰, 태블릿 PC, PDA(Personal Digital Assistant) 등의 정보 처리 장치에서 사용자로부터 질의(query)를 입력받고, 다수의 데이터베이스에서 사용자 질의에 상응하는 데이터를 검색하여 사용자에게 제공하는 검색 방법 및 시스템에 대한 연구가 활발하게 진행되고 있다.Recently, information processing technology has been rapidly developed to receive a query from a user in an information processing device such as a smart phone, a tablet PC, a personal digital assistant (PDA), and search for data corresponding to the user query in a plurality of databases. Research on search methods and systems provided to users is being actively conducted.
특히, 빅데이터(Big Data) 시대가 도래함에 따라 검색 엔진 시스템을 통해 방대한 양의 데이터가 기록되어 있는 복수의 데이터베이스에서 사용자 질의에 상응하는 정확한 정보를 신속하게 검색하여 제공할 수 있다는 점에서 콘텐츠 검색, 지능형 로봇, 차세대 PC, 텔레매틱스, 홈네트워크와 같은 다양한 분야에서 활용될 것으로 기대된다.In particular, with the advent of the big data era, a content search engine system can quickly search for and provide accurate information corresponding to a user query in a plurality of databases in which a large amount of data is recorded. It is expected to be used in various fields such as intelligent robots, next generation PCs, telematics and home networks.
빅데이터란 개념이 등장한지는 어느 정도 시간이 흘렀지만, 그 동안 이러한 빅데이터를 사용하는 것은 주로 기업이 개인을 상대하거나, 기업이 기업을 상대하거나, 또는 공공 분야에서 이용되는 분야였다.Although the concept of big data has been around for some time, the use of such big data has largely been an area where companies deal with individuals, companies deal with companies, or are used in the public sector.
한편, 기존의 인터넷 키워드 검색은 예를 들어 포털 사이트의 관련 서버 내에 저장된 데이터 또는 인터넷상에 있는 데이터를 검색하여 당해 키워드가 포함된(또는 관련성이 높은) 자료를 찾아서 제시한다. 제시되는 자료들은 대체로 웹페이지, 그림 파일, 동영상 파일 등이다. 그림, 동영상 등을 제외하면 대부분의 경우는 텍스트 자료로 된 홈페이지 링크가 검색되는 경우가 많다.On the other hand, the existing Internet keyword search, for example, by searching the data stored in the relevant server of the portal site or data on the Internet to find and present (or highly relevant) data containing the keyword. The materials presented are usually web pages, picture files, and video files. Except for pictures and videos, in most cases, links to homepages with text data are often found.
종래의 검색은 검색 키워드와 관련된 특정의 자료(즉, 특정의 언론 기사, 특정의 블로그 글, 특정의 이미지, 특정의 비디오 등)를 찾아준다. 기존에 검색에서 가장 맨 위에 나오는 검색물(홈페이지 링크)은 '홍길동'을 대표하는 글일 수도 있고 아닐 수도 있다. 즉, 단지 가장 최근의 글이라서 가장 위에 나올 수도 있고, 그다지 화제가 되고 있지 않은 주제인데도 가장 상단에 노출되는 경우도 충분히 있어 왔다. 이는, 기존의 검색은 당해 검색 키워드가 포함되어 있는지만 판단하지, 그 검색 결과의 내용을 전혀 고려하지 않기 때문에 발생하는 현상이다.Conventional search finds specific material related to a search keyword (i.e., a particular press article, a particular blog post, a specific image, a specific video, etc.). Previously, the top search item (homepage link) in the search may or may not be representative of 'Hong Gil-dong'. In other words, it is only the most recent post, so it may appear at the top, and even if it is not a topic, it has been exposed to the top. This is a phenomenon that occurs because the existing search judges only that the search keyword is included and does not consider the contents of the search result at all.
본 발명에 의하면, 전자 단말기를 통해 빅데이터를 이용하여 키워드를 검색하는 방법으로서, 상기 전자 단말기에서 검색 대상이 될 빅데이터 데이터베이스를 설정하는 단계; 상기 전자 단말기의 입력부를 통해, 검색 키워드를 입력받는 단계; 상기 전자 단말기는, 상기 빅데이터 데이터베이스에 포함된 각각의 자료들 중에서 상기 검색 키워드가 포함된 자료를 선정하는 단계; 상기 전자 단말기가, 상기 선정된 자료에 포함된 단어 또는 어구의 갯수를 카운트하는 단계; 상기 전자 단말기가, 상기 카운트한 단어 또는 어구를 출현 빈도순으로 순위를 정하는 단계; 상기 전자 단말기가, 상기 순위가 정해진 복수의 단어 또는 어구를 복수의 연관 검색어로서 선정하는 단계; 및 상기 전자 단말기의 디스플레이에, 상기 선정된 복수의 연관 검색어를 시각적으로 표시하는 단계를 포함하는 키워드 검색 방법이 제공된다.According to the present invention, a method for searching a keyword using big data through an electronic terminal, comprising: setting a big data database to be searched in the electronic terminal; Receiving a search keyword through an input unit of the electronic terminal; Selecting, by the electronic terminal, a material including the search keyword among respective materials included in the big data database; Counting, by the electronic terminal, the number of words or phrases included in the selected data; Ranking, by the electronic terminal, the counted word or phrase in order of appearance frequency; Selecting, by the electronic terminal, the plurality of ranked words or phrases as a plurality of related search words; And visually displaying the selected plurality of related search words on a display of the electronic terminal.
바람직하게는, 상기 표시하는 단계는, 순위가 높은 연관 검색어일수록 큰 글씨로 표시한다.Preferably, the displaying may be performed in larger letters as a related search word having a higher ranking.
바람직하게는, 상기 표시하는 단계는, 순위가 높은 연관 검색어일수록 더 큰 원 또는 더 큰 다각형 박스 내에 표시한다.Preferably, the displaying may be performed in a larger circle or a larger polygon box with a higher ranking search term.
바람직하게는, 상기 표시하는 단계는, 순위에 따라 글씨의 색을 다르게 하거나, 또는 일부 순위의 글씨를 가로쓰기하고 다른 일부 순위의 글씨를 세로쓰기하여 배치한다.Preferably, the displaying may be performed by changing the color of the text according to the ranking, or writing the letters of some ranks horizontally and writing the letters of the other ranks vertically.
바람직하게는, 상기 빅데이터 데이터베이스는 SNS 글이다.Preferably, the big data database is an SNS article.
바람직하게는, 상기 키워드 검색에 의해 특정의 기업 또는 사업체를 평가한다.Preferably, a specific company or business is evaluated by the keyword search.
본 발명에 의하면, 빅데이터를 이용하여 키워드를 검색하는 전자 장치로서, 검색 대상이 될 빅데이터 데이터베이스를 설정하는 설정부; 검색 키워드를 입력받을 입력부; 제어부; 및 디스플레이를 포함하며, 상기 제어부는, 상기 빅데이터 데이터베이스에 포함된 각각의 자료들 중에서 상기 검색 키워드가 포함된 자료를 선정하고, 상기 선정된 자료에 포함된 단어 또는 어구의 갯수를 카운트하고, 상기 카운트한 단어 또는 어구를 출현 빈도순으로 순위를 정하고, 상기 순위가 정해진 복수의 단어 또는 어구를 복수의 연관 검색어로서 선정하고, 상기 디스플레이로 하여금, 상기 선정된 복수의 연관 검색어를 시각적으로 표시하도록 제어하는, 키워드 검색 전자 장치가 제공된다.According to the present invention, there is provided an electronic device for searching a keyword using big data, comprising: a setting unit for setting a big data database to be searched for; An input unit to receive a search keyword; Control unit; And a display, wherein the controller is configured to select a material including the search keyword among respective materials included in the big data database, count the number of words or phrases included in the selected data, and The counted words or phrases are ranked in order of appearance frequency, the plurality of ranked words or phrases are selected as a plurality of related search terms, and the display is controlled to visually display the selected plurality of related search terms. A keyword retrieval electronic device is provided.
바람직하게는, 상기 제어부의 상기 디스플레이 제어는, 순위가 높은 연관 검색어일수록 큰 글씨로 표시하도록 한다.Preferably, the display control of the control unit displays the related search word having a higher ranking in larger letters.
바람직하게는, 상기 제어부의 상기 디스플레이 제어는, 순위가 높은 연관 검색어일수록 더 큰 원 또는 더 큰 다각형 박스 내에 표시하도록 한다.Preferably, the display control of the control unit displays the higher-ranked related search word in a larger circle or a larger polygon box.
바람직하게는, 상기 제어부의 상기 디스플레이 제어는, 순위에 따라 글씨의 색을 다르게 하거나, 또는 일부 순위의 글씨를 가로쓰기하고 다른 일부 순위의 글씨를 세로쓰기하여 배치하도록 한다.Preferably, the display control of the control unit is arranged to change the color of the text according to the ranking, or to write the letters of some ranks and to write the letters of some other ranks vertically.
바람직하게는, 상기 빅데이터 데이터베이스는 SNS 글이다.Preferably, the big data database is an SNS article.
바람직하게는, 상기 키워드 검색에 의해 특정의 기업 또는 사업체를 평가하도록 한다.Preferably, the keyword search evaluates a particular company or business.
본 발명의 검색에 의하면, 연관 검색어는 검색 키워드와 가장 많이 함께 쓰이는 어휘이므로 당해 검색 키워드에 대해 매우 정확한 결과를 제공한다.According to the search of the present invention, since the related search word is a vocabulary that is used most frequently with the search keyword, it provides a very accurate result for the search keyword.
또한, 단지 순위를 텍스트로 나열만 하는 것에 그치지 않고, 본 발명의 일형태에 의하면, 제1 연관 검색어를 가장 큰 글씨로 표시하고, 제2 연관 검색어를 그 다음 큰 글씨로 표시하고, 제3 연관 검색어를 그 다음 큰 글씨(즉, 제2 연관 검색어보다 더 작은 글씨)로 표시하는 등으로 차등을 둘 수 있다. 그 외의 다른 시각적 배치도 무방하다.Furthermore, in addition to merely listing the rankings in text, according to one embodiment of the present invention, the first related search word is displayed in the largest font, the second related search word is displayed in the next large font, and the third association is used. The search term can then be differentiated by displaying the next larger letter (ie, a smaller letter than the second associated search term). Other visual arrangements are also acceptable.
이러한 빅데이터 검색을 통해서, 나온 연관 검색어를 보면, 당해 검색 키워드에 대해 인터넷상(더 좁게는 SNS 상)에서 어떠한 언급이 오고 가는지, 당해 검색 키워드에 대해 어떠한 사항이 이슈가 되고 있는지를 쉽게 파악할 수 있으며, 종래의 검색에서와 같이 사람의 추가 노력이 들지 않으며, 쓰레기 정보(garbage 또는 noise)가 상단에 검색될 수 있던 종래의 문제점(즉, 잘못된 정보를 얻게 되는 문제)을 해결할 수 있다.Through such big data search, looking at related search terms, it is easy to identify what references are coming and going on the Internet (or more narrowly on SNS) about the search keyword, and what is the issue about the search keyword. It does not require additional human effort as in the conventional search, and solves the conventional problem (that is, the problem of obtaining wrong information) in which garbage information (garbage or noise) can be searched at the top.
도 1은 본 발명에 따른 검색 결과의 일예를 시각적으로 나타낸 도면이다.1 is a diagram visually showing an example of a search result according to the present invention.
도 2는 본 발명에 따른 검색의 흐름도의 일예를 나타낸다.2 shows an example of a flow diagram of a search according to the present invention.
도 3은 본 발명에 따른 검색의 흐름을 크게 4단계로 구분하여 나타낸다.Figure 3 shows the flow of the search according to the present invention divided into four stages.
도 4~6은 본 발명에 따른 검색을 스마트폰 앱의 형태로 만든 일예로서, 도 3에서 언급된 '사용자 요청 연관어 입력' 과정을 나타낸다.4 to 6 are examples of making a search according to the present invention in the form of a smartphone app, and show a process of inputting a user request association word mentioned in FIG. 3.
도 7~8은 본 발명에 따른 검색을 스마트폰 앱의 형태로 만든 일예로서, 도 3에서 언급된 '실시간 데이터 수집' 과정을 나타낸다.7 to 8 are examples of making a search according to the present invention in the form of a smartphone app, and show a process of 'real time data collection' mentioned in FIG. 3.
도 9~10은 본 발명에 따른 검색을 스마트폰 앱의 형태로 만든 일예로서, 도 3에서 언급된 '데이터 분석' 과정을 나타낸다.9 to 10 are examples of making a search according to the present invention in the form of a smartphone app, and show the 'data analysis' process mentioned in FIG. 3.
도 11은 본 발명에 따른 검색을 스마트폰 앱의 형태로 만든 일예로서, 도 3에서 언급된 '시각화' 과정을 나타낸다.FIG. 11 is an example of making a search according to the present invention in the form of a smartphone app, and illustrates the process of 'visualization' referred to in FIG. 3.
도 12는 포털 이슈 단어 연관어 수집에 관한 도면이다.12 is a diagram illustrating collection of portal issue word association words.
도 13은 본 발명에 따른 장치의 일예를 나타낸다.13 shows an example of an apparatus according to the invention.
본 발명에 의하면, 전자 단말기를 통해 빅데이터를 이용하여 키워드를 검색하는 방법으로서, 상기 전자 단말기에서 검색 대상이 될 빅데이터 데이터베이스를 설정하는 단계; 상기 전자 단말기의 입력부를 통해, 검색 키워드를 입력받는 단계; 상기 전자 단말기는, 상기 빅데이터 데이터베이스에 포함된 각각의 자료들 중에서 상기 검색 키워드가 포함된 자료를 선정하는 단계; 상기 전자 단말기가, 상기 선정된 자료에 포함된 단어 또는 어구의 갯수를 카운트하는 단계; 상기 전자 단말기가, 상기 카운트한 단어 또는 어구를 출현 빈도순으로 순위를 정하는 단계; 상기 전자 단말기가, 상기 순위가 정해진 복수의 단어 또는 어구를 복수의 연관 검색어로서 선정하는 단계; 및 상기 전자 단말기의 디스플레이에, 상기 선정된 복수의 연관 검색어를 시각적으로 표시하는 단계를 포함하는 키워드 검색 방법이 제공된다.According to the present invention, a method for searching a keyword using big data through an electronic terminal, comprising: setting a big data database to be searched in the electronic terminal; Receiving a search keyword through an input unit of the electronic terminal; Selecting, by the electronic terminal, a material including the search keyword among respective materials included in the big data database; Counting, by the electronic terminal, the number of words or phrases included in the selected data; Ranking, by the electronic terminal, the counted word or phrase in order of appearance frequency; Selecting, by the electronic terminal, the plurality of ranked words or phrases as a plurality of related search words; And visually displaying the selected plurality of related search words on a display of the electronic terminal.
바람직하게는, 상기 표시하는 단계는, 순위가 높은 연관 검색어일수록 큰 글씨로 표시한다.Preferably, the displaying may be performed in larger letters as a related search word having a higher ranking.
바람직하게는, 상기 표시하는 단계는, 순위가 높은 연관 검색어일수록 더 큰 원 또는 더 큰 다각형 박스 내에 표시한다.Preferably, the displaying may be performed in a larger circle or a larger polygon box with a higher ranking search term.
바람직하게는, 상기 표시하는 단계는, 순위에 따라 글씨의 색을 다르게 하거나, 또는 일부 순위의 글씨를 가로쓰기하고 다른 일부 순위의 글씨를 세로쓰기하여 배치한다.Preferably, the displaying may be performed by changing the color of the text according to the ranking, or writing the letters of some ranks horizontally and writing the letters of the other ranks vertically.
바람직하게는, 상기 빅데이터 데이터베이스는 SNS 글이다.Preferably, the big data database is an SNS article.
바람직하게는, 상기 키워드 검색에 의해 특정의 기업 또는 사업체를 평가한다.Preferably, a specific company or business is evaluated by the keyword search.
본 발명에 의하면, 빅데이터를 이용하여 키워드를 검색하는 전자 장치로서, 검색 대상이 될 빅데이터 데이터베이스를 설정하는 설정부; 검색 키워드를 입력받을 입력부; 제어부; 및 디스플레이를 포함하며, 상기 제어부는, 상기 빅데이터 데이터베이스에 포함된 각각의 자료들 중에서 상기 검색 키워드가 포함된 자료를 선정하고, 상기 선정된 자료에 포함된 단어 또는 어구의 갯수를 카운트하고, 상기 카운트한 단어 또는 어구를 출현 빈도순으로 순위를 정하고, 상기 순위가 정해진 복수의 단어 또는 어구를 복수의 연관 검색어로서 선정하고, 상기 디스플레이로 하여금, 상기 선정된 복수의 연관 검색어를 시각적으로 표시하도록 제어하는, 키워드 검색 전자 장치가 제공된다.According to the present invention, there is provided an electronic device for searching a keyword using big data, comprising: a setting unit for setting a big data database to be searched for; An input unit to receive a search keyword; Control unit; And a display, wherein the controller is configured to select a material including the search keyword among respective materials included in the big data database, count the number of words or phrases included in the selected data, and The counted words or phrases are ranked in order of appearance frequency, the plurality of ranked words or phrases are selected as a plurality of related search terms, and the display is controlled to visually display the selected plurality of related search terms. A keyword retrieval electronic device is provided.
바람직하게는, 상기 제어부의 상기 디스플레이 제어는, 순위가 높은 연관 검색어일수록 큰 글씨로 표시하도록 한다.Preferably, the display control of the control unit displays the related search word having a higher ranking in larger letters.
바람직하게는, 상기 제어부의 상기 디스플레이 제어는, 순위가 높은 연관 검색어일수록 더 큰 원 또는 더 큰 다각형 박스 내에 표시하도록 한다.Preferably, the display control of the control unit displays the higher-ranked related search word in a larger circle or a larger polygon box.
바람직하게는, 상기 제어부의 상기 디스플레이 제어는, 순위에 따라 글씨의 색을 다르게 하거나, 또는 일부 순위의 글씨를 가로쓰기하고 다른 일부 순위의 글씨를 세로쓰기하여 배치하도록 한다.Preferably, the display control of the control unit is arranged to change the color of the text according to the ranking, or to write the letters of some ranks and to write the letters of some other ranks vertically.
바람직하게는, 상기 빅데이터 데이터베이스는 SNS 글이다.Preferably, the big data database is an SNS article.
바람직하게는, 상기 키워드 검색에 의해 특정의 기업 또는 사업체를 평가하도록 한다.Preferably, the keyword search evaluates a particular company or business.
이하, 도면을 참조하여 본 발명에 따른 시스템 및 방법을 설명한다.Hereinafter, a system and method according to the present invention will be described with reference to the drawings.
도 1은 본 발명에 따른 검색 결과의 일예를 시각적으로 나타낸 도면이다.1 is a diagram visually showing an example of a search result according to the present invention.
기존의 인터넷 키워드 검색은 예를 들어 포털 사이트의 관련 서버 내에 저장된 데이터 또는 인터넷상에 있는 데이터를 검색하여 당해 키워드가 포함된(또는 관련성이 높은) 자료를 찾아서 제시한다. 제시되는 자료들은 대체로 웹페이지, 그림 파일, 동영상 파일 등이다. 그림, 동영상 등을 제외하면 대부분의 경우는 텍스트 자료로 된 홈페이지 링크가 검색되는 경우가 많다.Existing Internet keyword searches, for example, search for data stored in relevant servers of portal sites or data on the Internet to find and present (or highly relevant) material containing the keyword. The materials presented are usually web pages, picture files, and video files. Except for pictures and videos, in most cases, links to homepages with text data are often found.
본 발명은 빅데이터를 데이터베이스로 하며, 그 검색 결과를 단순히 글씨로만 보여주는 것이 아니라, 직관적으로 인식되도록 글씨의 크기에 차등을 두어 연관 키워드를 보여준다.In the present invention, big data is used as a database, and the search results are not simply displayed in letters, but the related keywords are displayed by differentially increasing the size of the letters so as to be intuitively recognized.
예컨대, 국회의원 선거와 관련하여 특정 후보의 이름을 기존의 검색 사이트(네이버, 다음, 구글 등)에서 입력하면, 그 사람에 대한 신문 기사 등의 홈페이지 링크 자료 등이 나열될 것이다. 그러나, 본 발명에 의하면, 특정 후보 이름을 입력하는 경우, 검색 데이터베이스는 빅데이터로서 기존과 차이가 있다. 그리고, 웹페이지가 검색되는 것이 아니라, SNS 등의 빅데이터 자료에서 언급된 횟수를 기준으로 가장 많이 언급된 것을 상위에 보여준다. 상위에 보여준다 함은 검색 결과의 가장 상단에 보여주는 것도 가능하지만, 더 바람직하게는 가장 많이 언급된 것을 가장 큰 글씨로 보여주는 것이다.For example, if a particular candidate's name is entered in an existing search site (Naver, Daum, Google, etc.) in relation to the election of the members of the parliament, homepage link materials such as newspaper articles about the person will be listed. However, according to the present invention, when a specific candidate name is input, the search database differs from the conventional one as big data. In addition, the web page is not searched, but is shown at the top based on the number of times mentioned in big data such as SNS. Show at the top is also possible to show at the top of the search results, but more preferably to show the largest of the most mentioned.
특정 후보 이름(홍길동)을 본 발명에 따라 검색하면, 여러가지 키워드가 등장할 수 있겠으나, 예컨대 홍길동 후보가 병역 비리에 관해 언론 등에 많이 노출되고 그에 따라 SNS에서도 홍길동 후보의 병역 비리에 대해 많이 언급되어 있다고 가정하면, "홍길동"이라는 검색 키워드에 대해서 본 발명의 방법 및 장치는 연관 키워드(즉, 검색 결과)로서 SNS 상에서 홍길동 후보에 대해 가장 많이 언급된 "병역 비리"를 제1 연관 키워드(즉, '홍길동'이라는 키워드와 가장 많이 SNS 글에서 함께 언급되는 키워드)로 선정할 수 있다. 예컨대, 어떤 SNS 글(트위터 멘션 등)이 "홍길동 후보가 병역 비리 의혹을 받고 있다"라고 되어 있으면 '홍길동' 키워드의 연관 검색어는 이 SNS 글에 한정하면, '후보' '병역 비리' '의혹' 등이 될 수 있으며, 이러한 취지의 글(예컨대, "홍길동 후보가 병역 비리로 수사를 받고 있습니다")라는 글이 많을수록 '홍길동'이라는 검색 키워드에 대한 '병역 비리'의 연관도(일치 횟수)는 점점 높아질 것이다. 그리고, 이와 유사한 어휘를 사용하는 SNS 글이 많거나 또는 당해 SNS 등이 많이 확대/재생산(예컨대, 트위터의 리트윗 기능 등)되어 있다면, 연관도(일치 횟수)가 점점 올라갈 것이다.If a specific candidate name (Hong Gil-dong) is searched according to the present invention, various keywords may appear, but for example, Hong Gil-dong has been exposed to the press for military service corruption, and so on SNS, he has been mentioned much about the military corruption of candidates. Assume that, for the search keyword "Hong Gil-dong", the method and apparatus of the present invention may refer to the first related keyword (i.e., "military corruption" most frequently mentioned for candidate Hong Gil-dong on SNS as the related keyword (ie, the search result). The keyword 'Hong Gil-dong' and the keyword most frequently mentioned together in the SNS article) can be selected. For example, if an SNS article (Twitter Mention, etc.) says "Hong Gil-dong candidate is suspected of military service corruption", the related search term of "Hong Gil-dong" keyword is limited to this SNS article, "candidate" "military corruption" "suspect" The more articles with the purpose of this article (eg, "Hong Gil-dong is under investigation for military service corruption"), the more relevant the number (matches) of "military corruption" to the search keyword "Hong Gil-dong" It will get higher. And, if there are many SNS articles using similar vocabulary or the SNS is expanded / reproduced (eg, Twitter retweet function, etc.), the degree of association (matching number) will gradually increase.
그리고, 그 다음으로 '홍길동'이라는 키워드와 함께 많이 언급되는 키워드가 '공약'이라고 하면, 제2 연관 키워드로 '공약'이 선정될 수 있다. 이러한 식으로 '홍길동'이라는 키워드와 함께 SNS 글 등의 빅데이터에서 가장 많이 연관되어 사용하는 키워드들의 순위를 매긴다. 이때의 검색 대상은 네이버 등의 포털 사이트와 같이 특정 서버 내부에 저장된 글에 한정되는 것이 아니라 빅데이터이므로, 이러한 검색의 정확도는 상당히 높을 것임을 예상할 수 있다. 연관 키워드로 선정하는 기준은 예컨대 검색 키워드와 천번 이상 함께 언급된 키워드만으로 한정하여 그 중에서 순위를 매길 수도 있다.Then, if a keyword frequently referred to together with the keyword 'Hong Gil-dong' is 'commit', 'commit' may be selected as the second related keyword. In this way, along with the keyword 'Hong Gil-dong', the keywords most frequently used in big data such as SNS articles are ranked. In this case, the search target is not limited to a post stored in a specific server such as a portal site such as Naver, but big data, and thus the accuracy of the search can be expected to be quite high. The criterion for selecting the related keyword may be, for example, limited to only the keyword mentioned together with the search keyword more than a thousand times and ranked among them.
상기 설명을 통해, 이는 기존의 포털 사이트에서의 검색과는 매우 상이함을 알 수 있다. 기존의 포털 사이트에서의 검색은 당해 포털 사이트에 의해 미리 수집되어 있는 데이터만을 대상으로 하는 경우도 있고(예컨대, 네이버, 다음), 미리 수집되어 있지 않더라도 인터넷을 전반적으로 검색하는 경우도 있다(예컨대, 구글). 본 발명은 통상의 인터넷 전반을 검색 대상으로 하는 것도 가능하지만, 바람직하게는 그 중에서도 빅데이터만을 대상으로 하는 것이 더 좋다. 빅데이터라 함은 일예로서 트위터, 페이스북 등의 SNS 글을 의미한다. 물론, 경우에 따라서는 전술한 바와 같이 인터넷 전반의 자료(예컨대, 인터넷 언론 기사, 블로그 글 등)를 포함하여 검색을 하여도 좋다. 그러나, 기존의 검색과 상이한 점은 검색 키워드와 관련된 특정의 자료(즉, 특정의 언론 기사, 특정의 블로그 글, 특정의 이미지, 특정의 비디오 등)를 찾아주는 것이 아니라, 빅데이터 전체에서 당해 검색 키워드와 함께 등장하는(즉, 동일한 문단이나 동일한 글 내에 있는) 다른 연관 키워드의 빈도를 찾아내어 순위를 결정하고 그 순위를 보여준다는 점이다. 기존에 검색에서 가장 맨 위에 나오는 검색물(홈페이지 링크)은 '홍길동'을 대표하는 글일 수도 있고 아닐 수도 있다. 즉, 단지 가장 최근의 글이라서 가장 위에 나올 수도 있고, 그다지 화제가 되고 있지 않은 주제인데도 가장 상단에 노출되는 경우도 충분히 있어 왔다. 이는 기존의 검색은 당해 검색 키워드가 포함되어 있는지만 판단하지, 그 검색 결과의 내용을 전혀 고려하지 않기 때문에 발생하는 현상이다. 그러나, 본 발명의 검색에 의하면, 제1 연관 검색어는 검색 키워드와 가장 많이 함께 쓰이는 어휘이므로 당해 검색 키워드에 대해 매우 정확한 결과를 제공한다.From the above description, it can be seen that this is very different from the search in the existing portal site. Searches on existing portal sites may only target data pre-collected by the portal site (e.g. Naver, Daum), or may search the entire Internet, even if not previously collected (e.g., Google). Although the present invention can also target the general Internet as a search target, it is preferable to target only the big data, among others. Big data refers to SNS articles such as Twitter and Facebook as an example. Of course, in some cases, as described above, a search may be performed including the entire Internet data (for example, Internet press articles, blog posts, etc.). However, the difference from the existing search is that it does not search for specific material related to the search keyword (ie, specific press article, specific blog post, specific image, specific video, etc.), but searches the entire big data. It finds the frequency of other related keywords that appear with the keyword (that is, in the same paragraph or in the same article), ranks them, and displays the ranking. Previously, the top search item (homepage link) in the search may or may not be representative of 'Hong Gil-dong'. In other words, it is only the most recent post, so it may appear at the top, and even if it is not a topic, it has been exposed to the top. This phenomenon occurs because the existing search judges only that the search keyword is included and does not consider the contents of the search result at all. However, according to the search of the present invention, since the first related search word is a vocabulary that is used most frequently with the search keyword, it provides a very accurate result for the search keyword.
또한, 단지 순위를 텍스트로 나열만 하는 것에 그치지 않고, 본 발명의 일형태에 의하면, 제1 연관 검색어를 가장 큰 글씨로 표시하고, 제2 연관 검색어를 그 다음 큰 글씨로 표시하고, 제3 연관 검색어를 그 다음 큰 글씨(즉, 제2 연관 검색어보다 더 작은 글씨)로 표시하는 등으로 차등을 둘 수 있다. 이 경우 제1 연관 검색어가 반드시 가장 상단에 있을 필요는 없고, 검색 단말 화면의 중앙부에 나와도 좋고, 그 외의 다른 위치에 표시되어도 좋다. 글씨 크기가 가장 크기 때문에 화면의 어디에 표시되어도 제1 연관 검색어임을 쉽게 알 수 있을 것이다. Furthermore, in addition to merely listing the rankings in text, according to one embodiment of the present invention, the first related search word is displayed in the largest font, the second related search word is displayed in the next large font, and the third association is used. The search term can then be differentiated by displaying the next larger letter (ie, a smaller letter than the second associated search term). In this case, the first related search word does not necessarily need to be at the top, but may appear in the center of the search terminal screen, or may be displayed in other positions. Since the font size is the largest, it can be easily understood that the first related search word is displayed anywhere on the screen.
이와 같이 글씨 크기도 연관도 순위를 표시할 수도 있고, 원의 크기로 연관도 순위를 표시하여, 가장 큰 원 안에 제1 연관 검색어를 넣고, 그 다음 큰 원 안에 제2 연관 검색어를 넣어도 좋다. 원의 크기와 글자 크기라는 기준을 병용해도 좋음은 물론이다. 원의 위치도 가장 큰 것을 최상단에 표시하고 점차로 하단으로 갈수록 작아지게 할 수도 있고, 가장 큰 것을 최좌단에 표시하고 점차로 우단으로 갈수록 작아지게 할 수도 있고, 화면 중에 랜덤하게 표시하고 크기를 보고 사용자가 판단하게 할 수도 있다. 글씨는 반드시 가로 쓰기일 필요는 없고, 시각적으로, 직관적으로 파악될 수 있도록, 어떤 연관 검색어는 가로 쓰기, 어떤 연관 검색어는 세로 쓰기여도 무방하다. 또한, 연관 검색어별로 색깔을 달리하여도 좋다.As such, the font size may also indicate the degree of relevance ranking, or the degree of relevance ranking may be indicated by the size of the circle so as to put the first related search term in the largest circle and the second related search term in the next large circle. Of course, you can use the criteria of the size of the circle and the size of the letter together. The position of the circle can also be displayed at the top of the largest and gradually smaller toward the bottom, the largest can be displayed at the leftmost and gradually smaller toward the right, or randomly displayed on the screen and the size can be viewed by the user. You can make a judgment. The text does not necessarily need to be written horizontally, and some related search words may be written horizontally and some related search words may be written vertically so that they can be visually and intuitively understood. In addition, the color may be changed for each related search word.
이러한 빅데이터 검색을 통해서, 나온 연관 검색어를 보면, 당해 검색 키워드에 대해 인터넷상(더 좁게는 SNS 상)에서 어떠한 언급이 오고 가는지, 당해 검색 키워드에 대해 어떠한 사항이 이슈가 되고 있는지를 쉽게 파악할 수 있다.Through such big data search, looking at related search terms, it is easy to identify what references are coming and going on the Internet (or more narrowly on SNS) about the search keyword, and what is the issue about the search keyword. have.
한편, 이러한 복수의 연관 검색어의 나열에 그치지 않고, 예컨대 검색 단말의 화면에서 제1 연관 검색어를 클릭하면 어떠한 문구에서 당해 제1 연관 검색어가 나왔는지 추가로 보여주는 서비스를 제공할 수도 있다.On the other hand, not only the listing of the plurality of related search words, for example, when the first related search word is clicked on the screen of the search terminal, it is also possible to provide a service that further shows in which phrase the first related search word appeared.
즉, "홍길동"을 검색 키워드로 하여 제1 연관 검색어가 "병역 비리", 제2 연관 검색어가 "공약"이라면, 검색 결과 화면에 "병역 비리"가 가장 큰 글씨로, "공약"이 그 다음 큰 글씨로, 그리고 나머지 연관 검색어들이 각각의 순위에 맞는 글씨 크기로 나열되어 있을 것이다. 각각의 연관 검색어는 클릭할 수 있도록 구성될 수 있고, 특정의 연관 검색어(예컨대, "공약")를 클릭하면, 어떠한 글에서 "홍길동"과 "공약"이 함께 언급되는지 구체적은 글을 볼 수 있게 되어 있다. 구체적인 글이라 함은, 빅데이터의 일부를 구성하는 글이며, 통상의 SNS 글이겠으나, 필요에 따라서 통상의 인터넷 사이트(예컨대, 인터넷 언론이나 블로그 등)의 글까지 포함하도록 검색하여도 무방하다.That is, if the first related search term is "military corruption" and the second related search term is "commitment" using "Hong Gil-dong" as the search keyword, "commitment" is the largest letter on the search result screen, and then "commitment" is next. The large text and the rest of the related search terms will be listed in the appropriate font size for each ranking. Each related search term can be configured to be clickable, and when a specific related search term (eg, "commitment") is clicked, a specific article about which "Hong Gil-dong" and "commitment" are mentioned together can be viewed. It is. The specific writing is a writing that constitutes a part of the big data, and may be a normal SNS writing, but may be searched to include a writing of a normal internet site (eg, an internet press or a blog) as necessary.
앞에서는 국회의원을 예로 들었으나, 다른 예로 연예인인 '투야'를 검색하는 경우의 예를 도 1에 나타낸다. 작동 원리는 앞서 설명한 바와 동일하다.In the above, the lawmaker was taken as an example, but another example is shown in FIG. The principle of operation is the same as described above.
즉, '투야'라는 검색어에 대해서 가장 많이 연관된 단어(제1 연관 검색어)는 "김지혜"이며, 도 1의 가운데에 큰 글씨로 표시되어 있다. 그 다음으로 많이 연관된 단어(제2 연관 검색어)는 "슈가맨"이며, 도 1의 가운데에서 약간 하단에 큰 글씨로 표시되어 있다. 그 다음으로 많이 연관된 단어(제3 연관 검색어)는 "안진경"이며, 도 1의 가운데에서 약간 상단에 조금 더 작은 글씨로 표시되어 있다. 그 외의 연관 검색어(즉, 제4 연관 검색어 이하)는 가운데의 "김지혜"라는 글씨를 둘러싸는 형태로 여러개 표시되어 있는 것을 볼 수 있다.That is, the most related word (first related search word) for the search term 'tuya' is “Kim Ji-hye” and is indicated in large letters in the center of FIG. 1. The next most relevant word (second related search term) is "Sugar Man", which is indicated in large letters at the bottom slightly in the middle of FIG. The next most related word (third related search term) is "eye glasses", which are indicated in a slightly smaller font at the top slightly in the middle of FIG. It can be seen that other related search terms (ie, below the fourth related search term) are displayed in a form enclosing the letter "Kim Ji-hye" in the center.
본 발명에 따른 방법 또는 장치를 서비스함에 있어서 일반 서비스 버전은 연관 검색어만을 제공하고, 유료 서비스 버전은 연관 검색어를 클릭하여 구체적인 글(어떤 문구에서 나왔는지)을 볼 수 있도록 구성할 수도 있다.In the service of the method or apparatus according to the present invention, the general service version may provide only related search terms, and the paid service version may be configured so that a specific article (which phrase comes from) may be clicked on.
빅데이터는 예컨대, 테라데이터사(社)와 같은 업체와의 연계/협약 등을 통해 제공받을 수도 있다. 이러한 연계를 통해서 개인이 공공 서비스의 빅데이터를 볼 수 있을 것이다. Big data may be provided through, for example, an association / agreement with a company such as Teradata. This linkage will enable individuals to see the big data of public services.
또다른 예를 들어 보면, 예컨대 특정의 맛집 이름을 검색하는 것을 상정해 볼 수 있다. 본 발명에 의하면, 특정의 맛집 이름을 검색할 때, 예컨대, "짜다"라는 연관 검색어가 나올 수 있고, "맛있다"라는 연관 검색어가 나올 수 있다. 둘 다 많이 나오지만, "짜다"가 가장 많이 연관되어 있는 검색어라면 이를 가장 지배적인 것이라고 볼 수 있다. 즉, 특정의 맛집 이름을 검색하였을 때, 제1 연관 검색어가 "짜다"이고 제2 연관 검색어가 "맛있다"라면, 본 발명의 사용자는 당해 특정의 맛집이 맛있기는 한데 대체로 짜게 조리하는구나 하는 정보를 얻을 수 있다. 기존의 검색에 의하면, 가장 상위에 뜨는 당해 맛집의 리뷰를 쭉 읽어볼 수 밖에 없다. 이는 상당한 시간이 걸리는 작업이고, 당해 리뷰가 반드시 공정하다고 볼 수 없다. 즉, 홍보성 블로그 글이 우연이 가장 상단에 검색되어 버릴 수도 있는 종래의 검색에서는 당해 특정 맛집에 대한 잘못된 정보를 갖게 될 가능성이 매우 크다. 그러나, 본 발명의 검색에 의하면, 예컨대, 당해 맛집의 이름과 "짜다"라는 단어가 동시에 나온 글(자료)이 상당히 많다는 것이므로, 단편적으로 하나의 글을 읽은 종래의 검색과는 전혀 다른 효과를 얻을 수 있음은 자명하다.As another example, for example, a search for a specific restaurant name may be assumed. According to the present invention, when searching for a specific restaurant name, for example, a related search term "weave" may come out, and a related search term "delicious" may come out. Both of them appear a lot, but the most relevant search term is "weave". That is, when a specific restaurant name is searched, if the first related search term is "weave" and the second related search term is "delicious," the user of the present invention may cook the salty food while the specific restaurant is delicious, but is generally cooked. Can be obtained. According to the existing search, there is no choice but to read the reviews of the restaurant that stands at the top. This is a time consuming task and the review is not necessarily fair. In other words, in a conventional search where a promotional blog post may be searched at the top of a coincidence, it is very likely to have wrong information about a particular restaurant. However, according to the search of the present invention, for example, since there are a lot of articles (materials) in which the name of the restaurant and the word "weave" appear at the same time, it is possible to obtain a completely different effect from the conventional search in which one article is read in pieces. It can be obvious.
특히, 본 발명에서 그래픽을 사용하는 경우에는, 예컨대 원의 크기를 달리하여 연관도의 크기를 나타낸다든지, 가로쓰기, 세로쓰기, 색깔 혼용 등을 통해 여러가지 시각적이고 직관적인 인터페이스를 제공하므로, 이해도 쉽고 정확한 정보를 얻을 수 있다.In particular, in the case of using the graphic in the present invention, for example, by varying the size of the circle to indicate the size of the degree of association, or to provide a variety of visual and intuitive interface through horizontal writing, vertical writing, color mixing, etc. You can get easy and accurate information.
이러한 본 발명에 의하면, 결과적으로, 개인이 식당, 기업 등을 평가하는 것이 가능하다. According to this invention, as a result, it is possible for an individual to evaluate a restaurant, a company, or the like.
종래의 검색에서는 키워드 검색을 통해 결과를 사람 눈으로 기사 등을 읽어서 내용을 확인해야 하므로, 결국은 사람의 힘이 상당 부분 필요하다. 그러나, 본 발명에 의하면, 기계가 읽어서 가장 많이 회자되는 글씨를 걸러주는 것이므로 사람의 힘이 크게 필요하지 않다. 그리고, 많이 검색되면 큰 글씨로 표시되므로 연관도의 파악이 매우 용이하며, 변별력이 부여된다. 반드시 큰 글씨 뿐만이 아니라, 하이라이트 표시라든지 색깔 차이 부여라든지, 여하한 시각적인 다른 효과를 부여하거나 병행하여도 좋다.In the conventional search, the contents must be checked by reading the article with the human eye through the keyword search, and eventually, a large amount of human power is required. However, according to the present invention, since the machine filters the most frequently read letters by reading, the human power is not necessary. And, if a large number of searches are displayed in large letters, it is very easy to grasp the degree of association, and discrimination is given. Not only large letters but also highlights, color differences, or any other visual effects may be given or combined.
본 발명에 따른 빅데이터의 대상은 기사, 블로그, SNS, 트위터 등 다양하게 다변화 가능하다. 이들의 일부 또는 전부를 사용할 수 있고, 필요에 따라 별도의 새로운 데이터베이스 체계에 적용하는 것도 가능하다. Big data according to the present invention can be variously diversified, such as articles, blogs, SNS, Twitter. Some or all of these can be used and can be applied to new, separate database systems as needed.
본 발명의 검색(연관 검색어 선정)을 위한 분석은 빅데이터 분석 기법으로서 머신 러닝(machine learing), 딥 러닝(deep learning) 등의 기법을 사용할 수 있으며, 본 발명의 방법 및 장치는 웹 기반으로, 또는 스마트폰의 앱(application) 기반으로 구현될 수도 있다. The analysis for searching (selecting related search terms) of the present invention may use techniques such as machine learing and deep learning as a big data analysis technique. The method and apparatus of the present invention are based on the web, Or it may be implemented based on the app (application) of the smartphone.
한편, 검색 결과(즉, 연관 검색어를 보여주는 것)의 일부를 다시 클릭하여 재검색하거나, 트위터나 블로그로 연결하는 것도 가능하다. 재검색한다 함은, "홍길동"을 검색하여 "병역 비리"가 제1 연관 검색어인 경우에, "병역 비리"를 클릭하면, 이제는 "병역 비리"가 검색 키워드가 되어 그에 따른 연관 검색어를 찾는 것이다. On the other hand, it is possible to click again on a part of the search result (i.e., display related search terms) to search again, or to link to Twitter or blog. Re-search means that when "Hong Gil-dong" is searched and "military corruption" is the first related search word, when "military corruption" is clicked, "military corruption" now becomes a search keyword and searches for the related search word accordingly.
'연관 검색어'라는 용어 자체는 다소 브로드한 용어일 수도 있으나, 이를 단순히 단어의 의미만으로 파악하면 안 되고, 전술한 바와 같은 본 발명의 전제 조건, 즉, 보여주는 형태라든지, 앱의 형태라든지, 검색의 대상이나 방법이 다르다든지 하는 조건들이 충족되는 한도에서의 연관 검색어를 말하는 것이므로, 용어만으로 판단할 것은 아니다.The term 'associated search term' itself may be a somewhat broad term, but it should not be understood simply by the meaning of the word, but the preconditions of the present invention as described above, that is, the form of the show, the form of the app, the search Since the term refers to a related search word within a condition that conditions, such as object or method, are satisfied, the term is not judged solely.
즉, 종래의 기술에 의하면 개인이 기업이나 마트 등을 상대로 평가할 수 있는 서비스가 불가능하거나 어렵지만, 본 발명에 의하면, 빅데이터를 구성하는 글 하나하나가 의미가 있는 평가 자료가 되고, 단순히 특정 단어가 들어간 글을 검색해서 보여주는 것과는 다른 방식임을 쉽게 알 수 있을 것이다. 예컨대, 종래에는 새로운 신용 카드를 발급한다면 자체 내부적으로 검색하여 평가하는 정도에 그치지만, 본 발명에 의하면, 일반인들이 빅데이터로 볼 수 있게 하는 서비스로서 전혀 다른 방식으로 활용될 수 있음은 자명하다.That is, according to the prior art, it is impossible or difficult for a service that an individual can evaluate against a company or a mart, but according to the present invention, each of the words constituting the big data becomes a meaningful evaluation material, and a specific word is simply It's easy to see that it's a different way of searching and showing what you've entered. For example, in the related art, if a new credit card is issued, the service is merely searched and evaluated internally. However, according to the present invention, it is obvious that the service can be used in a completely different manner as a service that allows the general public to view big data.
본 발명에 의하면, 일응용으로서, "홍길동"이라는 검색어를 넣으면 제1 연관 검색어가 무엇이 나올지를 예측하는 퀴즈 놀이를 하여도 좋다. 또는 어떤 검색어를 넣었을 때 검색어가 "병역 비리"가 나올지를 예측하는 퀴즈 놀이도 가능하다. 이는 젊은이들 사이에서 간단하고 재미있는 놀이로서도 기능할 수 있을 것이다.According to the present invention, as one application, if a search term "Hong Gil-dong" is put in, a quiz play for predicting what the first related search term may appear may be played. Or you can play a quiz that predicts when a search term will appear "military irregularities" when you enter. It may also function as a simple and fun play among young people.
종래의 검색에 있어서, 데이터량이 많아지만 사실상, 접근(access) 및 처리에 어려움이 있다. 스마트폰이 아니라 PC에서 행해도 어려움이 있기는 마찬가지이다. 예컨대, 그러한 번잡함(즉, 쓸모없는 정보가 검색되는 것)을 피하기 위해, 신문사의 홈페이지에 들어가서 검색하는 사람도 있는데, 이렇게 노이즈를 거르고 싶은 사람들을 위해서도 본 발명은 좋은 도구가 될 수 있을 것이다.In the conventional search, although the amount of data is large, in fact, there is a difficulty in access and processing. Even if you do it in a PC, not a smartphone, it is the same. For example, in order to avoid such troublesomeness (that is, searching for useless information), there is a person who enters and searches the homepage of a newspaper, and for the person who wants to filter out the noise, the present invention can be a good tool.
현재, 웹 상의 신문 기사의 경우, 검색 결과를 중요도 순으로 배치하기도 한다. 그러나, 첫번째 기사에서 마지막 기사로 가면서 훑어보어도 갈수록 비슷한 말이 사용된 것 같기도 하여, 결국은 사람이 일일이 각각의 기사를 보기 전에는 미묘한 사항은 알기 힘들다. 그러나, 본 발명에 의하면, 각각의 기사(빅데이터가 신문 기사 데이터베이스인 경우)의 단어를 카운트하게 되므로 종래의 검색과는 다른 새로운 의미를 지닌다. 즉, 단어의 출현 빈도에 따라 중심 키워드를 선정할 수 있다. 중심 키워드란 전술한 연관 검색어와 동일한 개념이라고 보아도 무방하다.Currently, newspaper articles on the Web often place search results in order of importance. However, as you go through the first article to the last, it seems that more and more similar words are used, so it's hard to know the subtleties before a person sees each article. However, according to the present invention, since the words of each article (when the big data is a newspaper article database) are counted, it has a new meaning different from the conventional search. That is, the central keyword may be selected according to the frequency of occurrence of the word. The central keyword may be regarded as the same concept as the aforementioned related search word.
한편, 시각화의 구체적인 형태는 전술하였으나, 그에 한정되지 않고 다양한 시각적 형태로 변별력을 줄 수 있다.Meanwhile, the specific form of the visualization has been described above, but the present invention is not limited thereto, and may provide discrimination in various visual forms.
워드 카운트(즉, 연관도 확인) 과정은 여러가지 알고리즘이 사용될 수 있으며 가중치를 부여하는 방식도 사용가능하다. 그리고, 빅데이터 중의 일부 데이터가 상업성을 띠는 글(자료)이라고 판단되면 그 글(자료)은 워드 카운트에서 배제하는 것도 가능하다. 상업성의 판단은, 예컨대 당해 자료의 문구 중에 소정의 (미리 정해진) 선전 문구가 들어있는지를 확인함으로써 가능할 수도 있고, 특정 홈페이지 주소가 포함되어 있는지를 확인함으로써 가능할 수도 있는 등, 여러가지 수단이 있을 수 있다.The word count (ie association checking) process may use various algorithms and weighting methods. If some data in the big data is determined to be a commercial article, the article may be excluded from the word count. Determination of the commerciality may be possible by various means, for example, by checking whether the text of the material contains a predetermined (predetermined) propaganda text, or by checking whether a specific homepage address is included. .
도 2는 본 발명에 따른 검색의 흐름도의 일예를 나타낸다.2 shows an example of a flow diagram of a search according to the present invention.
본 발명은 전자 단말기를 통해 빅데이터를 이용하여 키워드를 검색하는 방법 및 장치를 제공한다.The present invention provides a method and apparatus for searching for keywords using big data through an electronic terminal.
예컨대, 전자 단말기에서 검색 대상이 될 빅데이터 데이터베이스를 설정한다(단계 201). 그리고, 전자 단말기의 입력부를 통해, 검색 키워드를 입력받는다(단계 202).For example, an electronic terminal sets a big data database to be searched for (step 201). Then, the search keyword is input through the input unit of the electronic terminal (step 202).
전자 단말기는, 빅데이터 데이터베이스에 포함된 각각의 자료들 중에서 상기 검색 키워드가 포함된 자료를 선정한다(단계 203). 전자 단말기가, 선정된 자료에 포함된 단어 또는 어구의 갯수를 카운트한다(단계 204). 그리고, 전자 단말기가, 카운트한 단어 또는 어구를 출현 빈도순으로 순위를 정한다(단계 205).The electronic terminal selects the data including the search keyword from among the materials included in the big data database (step 203). The electronic terminal counts the number of words or phrases included in the selected data (step 204). Then, the electronic terminal ranks the counted words or phrases in order of appearance frequency (step 205).
전자 단말기가, 순위가 정해진 복수의 단어 또는 어구를 복수의 연관 검색어로서 선정한다(단계 206). 전자 단말기의 디스플레이에, 선정된 복수의 연관 검색어를 시각적으로 표시한다(단계 207).The electronic terminal selects a plurality of ranked words or phrases as a plurality of related search terms (step 206). The selected plurality of related search words are visually displayed on the display of the electronic terminal (step 207).
본 발명은 빅데이터 데이터베이스와 네트워크로 연결된 PC 등에서 동작할 수도 있고, 스마트폰 등의 기기에서 동작할 수도 있다.The present invention may operate in a PC connected to a big data database and a network, or may operate in a device such as a smartphone.
도 3은 본 발명에 따른 검색의 흐름을 크게 4단계로 구분하여 나타낸다.Figure 3 shows the flow of the search according to the present invention divided into four stages.
본 발명은 크게 보아 '사용자 요청 연관어 입력' 과정, '실시간 데이터 수집' 과정, '데이터 분석' 과정, '시각화' 과정을 거치는 것으로 볼 수도 있다.The present invention can be viewed as being largely passed through a 'user request association word input' process, a 'real time data collection' process, a 'data analysis' process, and a 'visualization' process.
이들 각각에 대해서 이하 설명한다.Each of these will be described below.
도 4~6은 본 발명에 따른 검색을 스마트폰 앱의 형태로 만든 일예로서, 도 3에서 언급된 '사용자 요청 연관어 입력' 과정을 나타낸다.4 to 6 are examples of making a search according to the present invention in the form of a smartphone app, and show a process of inputting a user request association word mentioned in FIG. 3.
도 4의 상단에는 검색창(입력창)이 표시되어 있고, 하단에는 포털 사이트(예컨대, 네이버, 다음 등)에서 이슈가 되고 있는 실시간 검색어가 순위별로 20개 표시되어 있다.In the upper part of FIG. 4, a search box (input box) is displayed, and in the lower part, 20 real-time search words that are an issue in a portal site (eg, Naver, Daum, etc.) are displayed by rank.
일예로, 본 발명에 따른 앱의 메인 페이지는 웹 앱을 목적으로 한 HTML 포맷으로 작성한다. HTML 문서내에는 사용자의 액션을 시스템 내부 프로그램으로 값을 전달하기 위한 java script로 구성한다.For example, the main page of the app according to the present invention is written in HTML format for the purpose of a web app. In an HTML document, you configure a user's action as a java script to pass values to an internal program.
도 4의 상단부에 표시된 입력창을 통해 사용자가 찾기를 원하는 단어를 입력 받을 수 있도록 하였으며, 엔터키 또는 아래의 분석 버튼을 클릭하여 입력된 내용을 내부 수집 프로그램으로 전달할 수 있도록 한다.Through the input window displayed in the upper part of FIG. 4, the user can receive a word that he / she wants to find, and the user can click the enter key or the analysis button below to transfer the input content to the internal collection program.
도 4의 하단부를 참조하면, 페이지 상단부의 사용자 입력부와는 별도로 하단부에는 포털 사이트들의 실시간 검색어 상위 20개 리스트 창을 배치한다. 실시간 검색어 순위를 자동으로 수집하여 그 단어에 연관된 웹자료를 수집하고 분석하여 사용자가 접속하는 메인 화면에 배치함으로서 사용자의 편의성에 대한 추가적인 가치를 부여한다.Referring to the lower part of FIG. 4, the top 20 list windows of real-time search terms of portal sites are arranged at the lower part separately from the user input part of the upper part of the page. It automatically collects real-time search term ranking, collects and analyzes web data related to the word, and places it on the main screen where the user accesses to add additional value for user convenience.
사용자 요청 연관어 기능(즉, 도 3의 상단부의 입력창과 관련된 기능)은 사용자가 본 발명에 따른 앱의 메인 페이지에 접속하여 최소 1개에서 다수개의 원하는 단어를 입력할 수 있도록 하는 기능을 제공한다. 기술적으로는, 텍스트(Text)를 인풋(Input) 값으로 받을 수 있도록 되어 있으며, 여러 개의 단어의 경우 공백으로 분리하여 입력 값으로 전달할 수 있도록 한다. 단어 입력없이 분석 버튼을 누르거나 엔터를 클릭하는 경우, 단어를 입력하라는 메시지를 사용자에게 리턴한다. 이러한 사항은, 예컨대, 도 5에 나타난 코드를 통해 구현 가능하다.The user request association word function (ie, a function related to the input window in the upper part of FIG. 3) provides a function of allowing a user to enter at least one to many desired words by accessing the main page of the app according to the present invention. . Technically, text can be received as an input value, and multiple words can be passed as input values separated by spaces. If you press the Analyze button or click Enter without entering a word, you are prompted to enter a word. This may be implemented through, for example, the code shown in FIG. 5.
다음으로, 사용자가 정상적인 단어를 입력하고 분석버튼 또는 엔터키를 클릭하는 경우 내부의 search.jsp 파일을 호출하여 입력받은 인자값을 전달한다. search.jsp는 전달받은 인자값을 데이터 수집 프로그램으로 다시 값을 전달한다. 이러한 사항은, 예컨대, 도 6에 나타난 코드를 통해 구현 가능하다.Next, when the user enters a normal word and clicks the Analyze button or Enter key, the internal search.jsp file is called to deliver the received argument value. search.jsp passes the passed argument values back to the data collection program. This may be implemented, for example, through the code shown in FIG. 6.
도 7~8은 본 발명에 따른 검색을 스마트폰 앱의 형태로 만든 일예로서, 도 3에서 언급된 '실시간 데이터 수집' 과정을 나타낸다.7 to 8 are examples of making a search according to the present invention in the form of a smartphone app, and show a process of 'real time data collection' mentioned in FIG. 3.
인터넷상의 실시간 데이터를 수집하는 것은 웹스크래핑 엔진 실행하여 사용자가 입력한 단어가 포함된 문서들을 검색하여 그 결과를 내부에 html 또는 plain text 형태로 저장한다. 검색결과는 사용자가 입력한 단어를 파일명으로 사용하도록 한다. 이러한 사항은, 예컨대, 도 7에 나타난 코드를 통해 구현 가능하다.Collecting real-time data on the Internet runs a web scraping engine, searches for documents containing the words entered by the user, and stores the results in html or plain text. The search result uses the word entered by the user as the file name. This may be implemented through, for example, the code shown in FIG. 7.
웹스크래핑 엔진을 통해서 수집된 초기 데이터는 바로 분석할 수 없는 html tag 및 불필요한 문자를 포함하고 있으므로 이러한 불필요한 내용을 정제하는 데이터 필터링 작업을 수행한다. 필터링 작업이 완료된 파일은 plain text 파일의 형태를 갖게 된다. 이러한 사항은, 예컨대, 도 8에 나타난 코드를 통해 구현 가능하다.The initial data collected through the web scraping engine contains html tags and unnecessary characters that cannot be analyzed immediately, so data filtering is performed to clean up these unnecessary contents. Once the filtering is done, the file will be in the form of a plain text file. This may be implemented through, for example, the code shown in FIG. 8.
부연 설명하자면, 도 4와 같이, 본 발명은 웹, SNS, 블로그 등의 여러가지 소스로부터 데이터를 수집하여 사용자 요청(즉, 도 4의 입력창에 입력되는 단어)의 연관어를 찾아내거나, 또는 포털 이슈 단어(즉, 도 4의 하단에 이슈 1~10, 이슈 11~20으로 표시된 단어)의 연관어를 수집할 수 있다.In detail, as shown in FIG. 4, the present invention collects data from various sources such as web, SNS, blog, and the like to find a related word of a user request (that is, a word entered in the input window of FIG. 4), or a portal. An association word of an issue word (ie, words marked as issues 1 to 10 and issues 11 to 20 at the bottom of FIG. 4) may be collected.
도 9~10은 본 발명에 따른 검색을 스마트폰 앱의 형태로 만든 일예로서, 도 3에서 언급된 '데이터 분석' 과정을 나타낸다.9 to 10 are examples of making a search according to the present invention in the form of a smartphone app, and show the 'data analysis' process mentioned in FIG. 3.
데이터 분석은 공개소프트웨어인 R의 KoNLP 패키지를 사용하여 한글 구문분석이 가능하도록 한다. 필터링 작업을 거친 텍스트 파일을 입력 받아 필터링 프로그램에서 제거하지 못한 불필요한 기호를 삭제하는 작업을 수행한다. 이러한 사항은, 예컨대, 도 9에 나타난 코드를 통해 구현 가능하다.Data analysis enables Korean parsing using KoNLP package of open software R. It takes a text file that has been filtered and deletes unnecessary symbols that could not be removed by the filtering program. This may be implemented through, for example, the code shown in FIG. 9.
다음으로, 추출한 명사를 목록으로 재작성하고 각 명사의 빈도수를 측정한다. 명사와 명사의 빈도수를 2차 분석을 위하여 상위 100개 단어를 별도의 csv 파일로 출력한다. 출력한 상위 100개 단어 중 20개를 추출하여 결과내 재검색의 키워드로 사용한다. 이러한 사항은, 예컨대, 도 10에 나타난 코드를 통해 구현 가능하다.Next, we rewrite the extracted nouns into a list and measure the frequency of each noun. Output the top 100 words in a separate csv file for secondary analysis of nouns and noun frequencies. Extract 20 of the top 100 words you output and use them as keywords in your search results. This may be implemented through, for example, the code shown in FIG. 10.
도 11은 본 발명에 따른 검색을 스마트폰 앱의 형태로 만든 일예로서, 도 3에서 언급된 '시각화' 과정을 나타낸다.FIG. 11 is an example of making a search according to the present invention in the form of a smartphone app, and illustrates the process of 'visualization' referred to in FIG. 3.
시각화는 R의 워드 클라우드(word cloud) 패키지를 사용하여 png 파일 포맷으로 출력을 하도록 한다. 워드 클라우드는 빅데이터 분석 결과 시각화에 있어서 단어 중 빈도수가 가장 높은 단어를 중앙에 크게 위치 시킨 후 그 다음 빈도수의 단어를 조금 작게 배치하는 형대로 출력을 한다. 출력된 결과는 단어의 모수가 많을수록 원형에 가깝게 된다. 이러한 사항은, 예컨대, 도 11에 나타난 코드를 통해 구현 가능하다.The visualization uses R's word cloud package to output in png file format. In the visualization of big data analysis results, the word cloud places the word with the highest frequency in the center and outputs the word with the smaller frequency. The more output the parameters are, the closer they are to the prototype. This may be implemented through, for example, the code shown in FIG. 11.
시각화작업을 완료한 결과는 최초 요청된 사용자 화면으로 그 결과를 전달한다. 전달되는 결과에는 결과 png 파일과 상위 10개 단어 목록이 포함된다. search.jsp 파일은 전달받은 png 파일명과 단어목록을 html 형태로 작성하여 사용자의 화면에 전달한다. 분석결과의 상위 10개 단어는 사용자의 재검색 편의를 위해 포털 사이트(예컨대, 네이버)의 검색창으로 링크가 되도록 한다. The result of completing the visualization is transferred to the first requested user screen. The result delivered includes the resulting png file and a list of the top 10 words. The search.jsp file creates the received png file name and word list in html format and delivers it to the user's screen. The top ten words of the analysis result are linked to the search box of the portal site (eg, Naver) for the user's re-search convenience.
이러한 과정을 거침으로써, 예컨대, 도 4의 입력창에 "투야"를 입력하면, 도 1과 같은 검색 결과를 얻을 수 있게 된다.By going through this process, for example, inputting "tuya" into the input window of Figure 4, it is possible to obtain a search result as shown in FIG.
한편, 도 4의 하단에 나타나는 이슈 1~10, 이슈 11~20의 단어와 관련하여 부연 설명하자면, 메인 화면에 표시하는 소정 갯수의 이슈단어(예컨대, 20개)의 목록은 일예로 매 5분마다 자동으로 포털에 접속하여 단어목록을 수집해 온다. 제공되는 정보의 실시간성을 유지하기 위해 동일한 단어의 경우는 2시간마다 새롭게 정보를 수집한다. 이렇게 수집된 목록은 웹스크랩 프로그램에 전달하고 그 분석 결과를 서버에 저장하여 사용자에게 제공한다. 이러한 사항은, 예컨대, 도 12에 나타난 코드를 통해 구현 가능하다.Meanwhile, referring to the words of the issues 1 to 10 and the issues 11 to 20 shown at the bottom of FIG. 4, the list of the predetermined number of issue words (eg, 20) displayed on the main screen is an example every 5 minutes. Every time the portal automatically connects to the word list has been collected. In order to maintain the real-time information of the information provided, the same word is newly collected every two hours. The collected list is delivered to the web scrap program and the analysis result is stored in the server and provided to the user. This may be implemented through, for example, the code shown in FIG. 12.
도 13은 본 발명에 따른 장치의 일예를 나타낸다.13 shows an example of an apparatus according to the invention.
빅데이터를 이용하여 키워드를 검색하는 전자 장치를 제공한다. 이 장치는 검색 대상이 될 빅데이터 데이터베이스를 설정하는 설정부(301), 검색 키워드를 입력받을 입력부(303), 제어부(305) 및 디스플레이(307)를 포함한다.An electronic device for searching a keyword using big data is provided. The apparatus includes a setting unit 301 for setting a big data database to be searched, an input unit 303 for receiving a search keyword, a controller 305 and a display 307.
제어부(305)는, 빅데이터 데이터베이스에 포함된 각각의 자료들 중에서 검색 키워드가 포함된 자료를 선정하고, 선정된 자료에 포함된 단어 또는 어구의 갯수를 카운트하고, 카운트한 단어 또는 어구를 출현 빈도순으로 순위를 정하고, 순위가 정해진 복수의 단어 또는 어구를 복수의 연관 검색어로서 선정하고, 디스플레이(307)로 하여금, 선정된 복수의 연관 검색어를 시각적으로 표시하도록 제어할 수 있다.The controller 305 selects a material including a search keyword from among materials included in the big data database, counts the number of words or phrases included in the selected data, and counts the counted words or phrases. The ranking may be performed in order, a plurality of ranked words or phrases may be selected as a plurality of related search terms, and the display 307 may be controlled to visually display the selected plurality of related search terms.
제어부(305)는 예컨대, PC의 CPU 또는 스마트폰의 CPU일 수 있다.The controller 305 may be, for example, a CPU of a PC or a CPU of a smartphone.
위에서는 특정의 예를 들어 설명하였으나, 본 발명은 상기 실시예에 한정되지 않으며, 당 분야의 통상의 지식을 가진 자에 의하여 많은 변형이 첨부의 특허청구범위에 기재된 본 발명의 본질적인 사상 내에서 가능함은 물론이다. 본 발명의 기본 사상을 벗어나지 않는 한, 그 외의 다양한 변형도 본 발명의 범주에 속하는 것으로 보아야 할 것이다.Although specific examples have been described above, the present invention is not limited to the above embodiments, and many modifications are possible within the essential spirit of the present invention as set forth in the appended claims by those skilled in the art. Of course. Various other modifications should be considered to be within the scope of the present invention, without departing from the basic spirit of the invention.
본 발명은 빅데이터를 이용한 검색 방법 및 장치에 관한 것으로서, 산업상 이용가능성을 갖는다.The present invention relates to a search method and apparatus using big data, and has industrial applicability.

Claims (12)

  1. 전자 단말기를 통해 빅데이터를 이용하여 키워드를 검색하는 방법으로서, A method for searching for keywords using big data through an electronic terminal,
    상기 전자 단말기에서 검색 대상이 될 빅데이터 데이터베이스를 설정하는 단계;Setting a big data database to be searched in the electronic terminal;
    상기 전자 단말기의 입력부를 통해, 검색 키워드를 입력받는 단계;Receiving a search keyword through an input unit of the electronic terminal;
    상기 전자 단말기는, 상기 빅데이터 데이터베이스에 포함된 각각의 자료들 중에서 상기 검색 키워드가 포함된 자료를 선정하는 단계;Selecting, by the electronic terminal, a material including the search keyword among respective materials included in the big data database;
    상기 전자 단말기가, 상기 선정된 자료에 포함된 단어 또는 어구의 갯수를 카운트하는 단계;Counting, by the electronic terminal, the number of words or phrases included in the selected data;
    상기 전자 단말기가, 상기 카운트한 단어 또는 어구를 출현 빈도순으로 순위를 정하는 단계;Ranking, by the electronic terminal, the counted word or phrase in order of appearance frequency;
    상기 전자 단말기가, 상기 순위가 정해진 복수의 단어 또는 어구를 복수의 연관 검색어로서 선정하는 단계; 및Selecting, by the electronic terminal, the plurality of ranked words or phrases as a plurality of related search words; And
    상기 전자 단말기의 디스플레이에, 상기 선정된 복수의 연관 검색어를 시각적으로 표시하는 단계Visually displaying the selected plurality of related search terms on a display of the electronic terminal;
    를 포함하는 키워드 검색 방법.Keyword search method comprising a.
  2. 제1항에 있어서,The method of claim 1,
    상기 표시하는 단계는, 순위가 높은 연관 검색어일수록 큰 글씨로 표시하는 키워드 검색 방법.The displaying step is a keyword search method for displaying the related words having higher ranking in larger letters.
  3. 제1항에 있어서,The method of claim 1,
    상기 표시하는 단계는, 순위가 높은 연관 검색어일수록 더 큰 원 또는 더 큰 다각형 박스 내에 표시하는 키워드 검색 방법.The displaying may include displaying the related search word having a higher ranking in a larger circle or a larger polygon box.
  4. 제1항에 있어서,The method of claim 1,
    상기 표시하는 단계는, 순위에 따라 글씨의 색을 다르게 하거나, 또는 일부 순위의 글씨를 가로쓰기하고 다른 일부 순위의 글씨를 세로쓰기하여 배치하는 키워드 검색 방법,The displaying may include a keyword retrieval method of changing the color of the text according to the ranking, or writing the letters of some ranks horizontally and writing the letters of some other ranks vertically,
  5. 제1항에 있어서,The method of claim 1,
    상기 빅데이터 데이터베이스는 SNS 글인, 키워드 검색 방법.The big data database is an SNS article, keyword search method.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서,The method according to any one of claims 1 to 5,
    상기 키워드 검색에 의해 특정의 기업 또는 사업체를 평가하는 키워드 검색 방법.A keyword search method for evaluating a specific company or business by the keyword search.
  7. 빅데이터를 이용하여 키워드를 검색하는 전자 장치로서, An electronic device for searching a keyword using big data,
    검색 대상이 될 빅데이터 데이터베이스를 설정하는 설정부;A setting unit for setting a big data database to be searched for;
    검색 키워드를 입력받을 입력부;An input unit to receive a search keyword;
    제어부; 및Control unit; And
    디스플레이display
    를 포함하며, Including;
    상기 제어부는, 상기 빅데이터 데이터베이스에 포함된 각각의 자료들 중에서 상기 검색 키워드가 포함된 자료를 선정하고, 상기 선정된 자료에 포함된 단어 또는 어구의 갯수를 카운트하고, 상기 카운트한 단어 또는 어구를 출현 빈도순으로 순위를 정하고, 상기 순위가 정해진 복수의 단어 또는 어구를 복수의 연관 검색어로서 선정하고, 상기 디스플레이로 하여금, 상기 선정된 복수의 연관 검색어를 시각적으로 표시하도록 제어하는, 키워드 검색 전자 장치.The controller selects a material including the search keyword from among materials included in the big data database, counts the number of words or phrases included in the selected data, and counts the counted words or phrases. A keyword search electronic device that ranks the order of appearance frequency, selects the plurality of ranked words or phrases as a plurality of related search terms, and controls the display to visually display the selected plurality of related search terms. .
  8. 제7항에 있어서,The method of claim 7, wherein
    상기 제어부의 상기 디스플레이 제어는, 순위가 높은 연관 검색어일수록 큰 글씨로 표시하도록 하는, 키워드 검색 전자 장치.The display control of the control unit is such that the high-ranked related search word is displayed in large letters.
  9. 제7항에 있어서,The method of claim 7, wherein
    상기 제어부의 상기 디스플레이 제어는, 순위가 높은 연관 검색어일수록 더 큰 원 또는 더 큰 다각형 박스 내에 표시하도록 하는, 키워드 검색 전자 장치.The display control of the controller is such that a higher ranking related search word is displayed in a larger circle or a larger polygon box.
  10. 제7항에 있어서,The method of claim 7, wherein
    상기 제어부의 상기 디스플레이 제어는, 순위에 따라 글씨의 색을 다르게 하거나, 또는 일부 순위의 글씨를 가로쓰기하고 다른 일부 순위의 글씨를 세로쓰기하여 배치하도록 하는, 키워드 검색 전자 장치.The display control of the control unit may be configured to change the color of the text according to the rank, or to write the letters of some ranks horizontally and to write the letters of the other partial ranks vertically.
  11. 제7항에 있어서,The method of claim 7, wherein
    상기 빅데이터 데이터베이스는 SNS 글인, 키워드 검색 전자 장치.The big data database is an SNS article, keyword search electronic device.
  12. 제7항 내지 제11항 중 어느 한 항에 있어서,The method according to any one of claims 7 to 11,
    상기 키워드 검색에 의해 특정의 기업 또는 사업체를 평가하도록 하는, 키워드 검색 전자 장치.A keyword search electronic device for evaluating a specific company or business by the keyword search.
PCT/KR2016/010324 2016-04-15 2016-09-13 Search method and apparatus using big data WO2017179778A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020160046118A KR101850853B1 (en) 2016-04-15 2016-04-15 Method and apparatus of search using big data
KR10-2016-0046118 2016-04-15

Publications (1)

Publication Number Publication Date
WO2017179778A1 true WO2017179778A1 (en) 2017-10-19

Family

ID=60042008

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2016/010324 WO2017179778A1 (en) 2016-04-15 2016-09-13 Search method and apparatus using big data

Country Status (2)

Country Link
KR (1) KR101850853B1 (en)
WO (1) WO2017179778A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114547474A (en) * 2022-04-21 2022-05-27 北京泰迪熊移动科技有限公司 Data searching method, system, electronic equipment and storage medium

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102140180B1 (en) * 2018-04-18 2020-07-31 양효정 Investment Intermediation System and Method Thereof
KR20240039777A (en) 2022-09-20 2024-03-27 인하대학교 산학협력단 Automatic Story Generation Method and System with Keyword Input

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020016809A (en) * 2000-03-29 2002-03-06 요트.게.아. 롤페즈 User interface providing automatic generation and ergonomic presentation of key word search criteria
US20080046411A1 (en) * 2004-05-29 2008-02-21 Nhn Corporation Method and System for Managing the Impressing of the Search Listing Based on Advertisement Group
KR20100058405A (en) * 2008-11-24 2010-06-03 삼성전자주식회사 Personalize search system on mobile device and method using the same method thereof
KR20140051222A (en) * 2011-06-13 2014-04-30 페이스북, 인크. Client-side modification of search results based on social network data
KR20140062635A (en) * 2012-11-14 2014-05-26 한국전자통신연구원 Apparatus and system for searching power user in social media and method thereof

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020016809A (en) * 2000-03-29 2002-03-06 요트.게.아. 롤페즈 User interface providing automatic generation and ergonomic presentation of key word search criteria
US20080046411A1 (en) * 2004-05-29 2008-02-21 Nhn Corporation Method and System for Managing the Impressing of the Search Listing Based on Advertisement Group
KR20100058405A (en) * 2008-11-24 2010-06-03 삼성전자주식회사 Personalize search system on mobile device and method using the same method thereof
KR20140051222A (en) * 2011-06-13 2014-04-30 페이스북, 인크. Client-side modification of search results based on social network data
KR20140062635A (en) * 2012-11-14 2014-05-26 한국전자통신연구원 Apparatus and system for searching power user in social media and method thereof

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114547474A (en) * 2022-04-21 2022-05-27 北京泰迪熊移动科技有限公司 Data searching method, system, electronic equipment and storage medium

Also Published As

Publication number Publication date
KR101850853B1 (en) 2018-04-20
KR20170118399A (en) 2017-10-25

Similar Documents

Publication Publication Date Title
Koshman et al. Web searching on the Vivisimo search engine
Pu et al. Subject categorization of query terms for exploring Web users' search interests
EP3259689A1 (en) Method and system for context based tab management
WO2011080899A1 (en) Information recommendation method
CN107016020A (en) The system and method for aiding in searching request using vertical suggestion
KR20120047333A (en) An assistant-adviser using the semantic analysis of community exchanges
Lin et al. Imagesieve: Exploratory search of museum archives with named entity‐based faceted browsing
JP6529133B2 (en) Apparatus, program and method for analyzing the evaluation of topics in multiple regions
JP2011108053A (en) System for evaluating news article
Ndumbaro Understanding user-system interactions: An analysis of OPAC users’ digital footprints
WO2020116914A1 (en) Method and device for evaluating web accessibility and openness
WO2017179778A1 (en) Search method and apparatus using big data
WO2017074066A1 (en) Internet content providing server and computer readable recording medium embodying same method
Anh et al. Extracting user requirements from online reviews for product design: A supportive framework for designers
Spitz et al. EVELIN: Exploration of event and entity links in implicit networks
KR20160002199A (en) Issue data extracting method and system using relevant keyword
KR20130113275A (en) Apparatus and method for visualization of a hyperlink using color attribute value
Wen et al. Key factors affecting user adoption of open-access data repositories in intelligence and security informatics: An affordance perspective
Cheng et al. Context-based page unit recommendation for web-based sensemaking tasks
AlNoamany Using web archives to enrich the live web experience through storytelling
Han et al. Using transaction logs to better understand user search session patterns in an image-based digital library
KR20080028031A (en) System extracting and displaying keyword and contents related with the keyword and method using the system
KR101440385B1 (en) Device for managing information using indicator
WO2011108845A2 (en) User matched blogger analysis system and method
WO2017078295A1 (en) Content management system and method

Legal Events

Date Code Title Description
NENP Non-entry into the national phase

Ref country code: DE

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16898740

Country of ref document: EP

Kind code of ref document: A1

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 05.02.2019)

122 Ep: pct application non-entry in european phase

Ref document number: 16898740

Country of ref document: EP

Kind code of ref document: A1