IPS ir Informācijas izguves sistēmu mērķis un funkcijas
IPS ir Informācijas izguves sistēmu mērķis un funkcijas

Video: IPS ir Informācijas izguves sistēmu mērķis un funkcijas

Video: IPS ir Informācijas izguves sistēmu mērķis un funkcijas
Video: Квартира в центре под Ремонт #Ремонт #квартира #Центр #Челябинск 2024, Aprīlis
Anonim

Mūsdienu cilvēkam ir grūti iedomāties dzīvi bez interneta un gandrīz momentānas piekļuves informācijas avotiem. Lietotājs reti domā par to, kā tiek veikta vajadzīgā satura meklēšana tīklā. Bet tas ir ļoti interesanti.

Informācijas izguves sistēma (IPS) ir sarežģīta programmatūras un aparatūras sistēma, kas atlasa informāciju pēc lietotāja pieprasījuma. Informācija uz serveriem tiek glabāta digitālā formā, kā kādreiz bibliotēku plauktos atradās grāmatas. Sistēma sastāv no daudzām apakšsistēmām. Katrs veic savu uzdevumu lietotāja pieprasījuma apstrādes procesā un sniedz viņam informāciju teksta vai skaņas formā. Atrisināmo uzdevumu daudzveidība nosaka mūsdienu informācijas izguves sistēmu (informācijas izguves sistēmas saīsinājums) arhitektūras sarežģītību. Sava veida "melnā kaste": pie ievades - pieprasījuma teksts, kas ir iekšā - nav zināms, izejā - visaptveroša informācija.

Kartes fails reālajā dzīvē
Kartes fails reālajā dzīvē

Ievades straumes

Pieprasa informāciju, ko persona veido teksta veidā sava sīkrīka ekrānā,veido nelielu daļu no meklētājprogrammas apstrādātajiem pieprasījumiem. Galvenos meklēšanas vaicājumu masīvus veido roboti, kas pieņem cilvēka pieprasījumu un veic daudzpakāpju meklēšanu un atgriezenisko saiti ar lietotāju. Informācijas izguves sistēmās ietilpst labi zināmie Google, Yandex un citi, kas katru dienu apstrādā miljoniem pieprasījumu.

Avota meklēšanas objekti

Sākotnējo meklēšanas interešu objektu kopa ir dokumenti, ieraksti, video, attēli un daudz kas cits. Tie ir izveidoti ārpus IPS. Vispārīgajai informācijas uzglabāšanas un izguves sistēmai ir jābūt iebūvētai bibliogrāfiskai sistēmai - sava veida katalogam, kas ļauj meklēt jebkāda veida objektus.

Objekti vai to digitālās transformācijas kļūst par IPS "ieejas resursu". Tieši starp tiem tiek atlasīta lietotājam nepieciešamā informācija.

Meklējiet informāciju
Meklējiet informāciju

Ārējie avoti

Informācijas atlases skats izmanto ārējos zināšanu avotus. Šī ir informācija, ko lietotājs meklē. Filmas nosaukums, citāts no grāmatas un daudz kas cits. Datora meklēšanai šī informācija ir jāpārtulko vaicājumā algoritmiskā valodā. IPS tas tiek darīts, izmantojot bloku vaicājumu izveidei, indeksēšanai un izstrādei.

Ideālā gadījumā šiem trim procesiem - attēlošanai, indeksēšanai un vaicājumu izstrādei - būtu jāpaļaujas uz identiskiem zināšanu avotiem, taču praksē tas nav sasniedzams.

Zināšanu avoti ir pastāvīgi jāpārskata un jāatjaunina, un atjauninājumam jābūt identiskam unsinhronizēts. Un ārējs zināšanu avots vienmēr ir hronoloģiski pirms tā izmantošanas meklētājprogrammās vaicājumam, dažreiz pat vairākus gadus.

Informācijas izguves sistēma
Informācijas izguves sistēma

Izrādes

Oriģinālo objektu attēlojumus veido ievades dati kādā kombinācijā vai pārveidoti saskaņā ar noteiktas informācijas izguves sistēmas noteikumiem un algoritmiem.

Skatījumi ir vairāk vai mazāk pārveidotas sākotnējā meklēšanas objekta kopijas. Nerediģēto pilno tekstu krājumā katrs teksts ir savs atveidojums. Muzeja eksponātu un artefaktu priekšmetu kolekcijā reprezentācija var būt transformēts priekšmeta apraksts ar tā attēlu. Dažos gadījumos attēlojums var būt daļēji atvasināts no oriģinālā objekta un daļēji no apraksta: bibliogrāfiskajās meklētājprogrammās attēlojumi tiek atvasināti no objekta - piemēram, nosaukums, autora vārds tiks apvienots ar darba anotāciju.

Nepieciešamā atrašana
Nepieciešamā atrašana

Meklējamais rādītājs

Tā kā informācija informācijas izguves sistēmās tiek glabāta reprezentācijas veidā, ir loģiski pieņemt, ka meklēšana tiek veikta atbilstoši attēlojumam un pēc atlases tiek nodota lietotājam. Praksē tas tā nav. Piemēram, pašreizējie tiešsaistes bibliotēku katalogi parasti ierobežo meklēšanu līdz dažiem laukiem: autors, nosaukums un subtitri skatā, kurā ir citi lauki, kas netiek meklēti. Tas ir pietiekams iemesls, kāpēc ir nepieciešams atšķirtskats un meklēšanas rādītājs, kas ir skata meklēšanas daļa. Tas nosaka visu, kam jābūt meklējamam. Meklējamu indeksu, piemēram, skatu un avota objektu, var sadalīt atsevišķos apakšindeksos, lai nodrošinātu precīzāku, mērķtiecīgāku meklēšanu

Meklētājprogrammām parasti ir iekšēji sintētiska struktūra, kas nodrošina atbilstību derīgiem meklēšanas rezultātiem. Šī struktūra ir meklējamā indeksa otrais komponents.

Procesuāli indeksēšanas procesu var īstenot dažādos veidos: meklējamo indeksu var iegūt, izmantojot:

  • burtiski kopē meklējamo attēlojumu;
  • kopējot skata informāciju. Tas var būt daļa vai visi skati, kas fiziski pastāv tikai kā fragmenti, kas izplatīti saskaņā ar meklēšanas indeksa izveides noteikumiem, kas tiks apkopoti, kad nepieciešams.
Meklēšanas pārvaldība
Meklēšanas pārvaldība

Pieprasījuma noformēšanas noteikumi un oficiālie pieprasījumi

Vaicājumu inženierija ir funkcija, kas ir starpnieks starp lietotāja vaicājumu un formālu vaicājumu. Tas pārveido lietotāja vaicājumu, saskaņojot to ar izguves komandu vārdnīcām, indeksa specifikāciju un indeksu pirms izguves. IPS attīstības rītausmā šī loma tradicionāli tika uzticēta kvalificētiem IT speciālistiem.

Datora vaicājumu izstrāde, kas var saskaņot vārdnīcas vaicājumus meklēšanas indeksu sistēmā, parasti tiek saukta par "vārdnīcas ievades" moduli. Šīs funkcijas automatizācija ir daudzsološa un piedāvā iespējas ekspertu un varbūtības meklēšanas metodēm.

Formāls pieprasījums kļūst par oficiālu pieprasījumu pēc lietotāja pieprasījuma konvertēšanas. Šādu formālu transformāciju piemēri ir saīsināšana, aizstāšana, normalizācija, vektorizācija un citas "ārējās" reprezentācijas transformācijas datora IPS (atšifrēšanas - informācijas izguves sistēmas) "iekšējos" attēlojumos.

Izvilktas dokumentu saišu kopas

Iegūtā informācijas avotu kopa loģiski ir skatu apakškopa, kas izveidota, izmantojot atbilstības kārtulas, kas tiek piemērotas oficiālajam vaicājumam ar meklējamo indeksu.

Parasti, bet ne obligāti, ir atsevišķs atkoptās informācijas kopas kārtošanas process. Tiešsaistes bibliotēku katalogi pirms parādīšanas parasti pārkārto saņemtās kopas pēc autora alfabētiskā secībā. Informācijas izguves sistēmās, kas veido stingru klasifikāciju, ranžēšanas secība ir pirms jebkādas pārkārtošanas.

Datu analīze
Datu analīze

Izvades straumes

Meklēšanas rezultātu izvadīšana tiek veikta tradicionāli displejā, biežāk citur vai kādam citam nolūkam izmantojamu objektu plūsmas veidā, pabeidz galveno meklēšanas cilpu. Šādas straumes var nosūtīt uz vizualizācijas ierīcēm, uzglabāšana turpmākai apstrādei vai izmantošana kā ievades straumes citos atlases pakalpojumos.

Informācijas izguves sistēmas nodrošina atgriezenisko saiti nojebkura atlases procesa rezultāts. Jebkura procesa rezultāts var būt atgriezeniskā saite citiem procesiem. Atsauksmes var būt par pamatu eksperta spriedumam jebkurā posmā.

Ieteicams: