2024 Autors: Howard Calhoun | [email protected]. Pēdējoreiz modificēts: 2023-12-17 10:35
Mūsdienu cilvēkam ir grūti iedomāties dzīvi bez interneta un gandrīz momentānas piekļuves informācijas avotiem. Lietotājs reti domā par to, kā tiek veikta vajadzīgā satura meklēšana tīklā. Bet tas ir ļoti interesanti.
Informācijas izguves sistēma (IPS) ir sarežģīta programmatūras un aparatūras sistēma, kas atlasa informāciju pēc lietotāja pieprasījuma. Informācija uz serveriem tiek glabāta digitālā formā, kā kādreiz bibliotēku plauktos atradās grāmatas. Sistēma sastāv no daudzām apakšsistēmām. Katrs veic savu uzdevumu lietotāja pieprasījuma apstrādes procesā un sniedz viņam informāciju teksta vai skaņas formā. Atrisināmo uzdevumu daudzveidība nosaka mūsdienu informācijas izguves sistēmu (informācijas izguves sistēmas saīsinājums) arhitektūras sarežģītību. Sava veida "melnā kaste": pie ievades - pieprasījuma teksts, kas ir iekšā - nav zināms, izejā - visaptveroša informācija.
Ievades straumes
Pieprasa informāciju, ko persona veido teksta veidā sava sīkrīka ekrānā,veido nelielu daļu no meklētājprogrammas apstrādātajiem pieprasījumiem. Galvenos meklēšanas vaicājumu masīvus veido roboti, kas pieņem cilvēka pieprasījumu un veic daudzpakāpju meklēšanu un atgriezenisko saiti ar lietotāju. Informācijas izguves sistēmās ietilpst labi zināmie Google, Yandex un citi, kas katru dienu apstrādā miljoniem pieprasījumu.
Avota meklēšanas objekti
Sākotnējo meklēšanas interešu objektu kopa ir dokumenti, ieraksti, video, attēli un daudz kas cits. Tie ir izveidoti ārpus IPS. Vispārīgajai informācijas uzglabāšanas un izguves sistēmai ir jābūt iebūvētai bibliogrāfiskai sistēmai - sava veida katalogam, kas ļauj meklēt jebkāda veida objektus.
Objekti vai to digitālās transformācijas kļūst par IPS "ieejas resursu". Tieši starp tiem tiek atlasīta lietotājam nepieciešamā informācija.
Ārējie avoti
Informācijas atlases skats izmanto ārējos zināšanu avotus. Šī ir informācija, ko lietotājs meklē. Filmas nosaukums, citāts no grāmatas un daudz kas cits. Datora meklēšanai šī informācija ir jāpārtulko vaicājumā algoritmiskā valodā. IPS tas tiek darīts, izmantojot bloku vaicājumu izveidei, indeksēšanai un izstrādei.
Ideālā gadījumā šiem trim procesiem - attēlošanai, indeksēšanai un vaicājumu izstrādei - būtu jāpaļaujas uz identiskiem zināšanu avotiem, taču praksē tas nav sasniedzams.
Zināšanu avoti ir pastāvīgi jāpārskata un jāatjaunina, un atjauninājumam jābūt identiskam unsinhronizēts. Un ārējs zināšanu avots vienmēr ir hronoloģiski pirms tā izmantošanas meklētājprogrammās vaicājumam, dažreiz pat vairākus gadus.
Izrādes
Oriģinālo objektu attēlojumus veido ievades dati kādā kombinācijā vai pārveidoti saskaņā ar noteiktas informācijas izguves sistēmas noteikumiem un algoritmiem.
Skatījumi ir vairāk vai mazāk pārveidotas sākotnējā meklēšanas objekta kopijas. Nerediģēto pilno tekstu krājumā katrs teksts ir savs atveidojums. Muzeja eksponātu un artefaktu priekšmetu kolekcijā reprezentācija var būt transformēts priekšmeta apraksts ar tā attēlu. Dažos gadījumos attēlojums var būt daļēji atvasināts no oriģinālā objekta un daļēji no apraksta: bibliogrāfiskajās meklētājprogrammās attēlojumi tiek atvasināti no objekta - piemēram, nosaukums, autora vārds tiks apvienots ar darba anotāciju.
Meklējamais rādītājs
Tā kā informācija informācijas izguves sistēmās tiek glabāta reprezentācijas veidā, ir loģiski pieņemt, ka meklēšana tiek veikta atbilstoši attēlojumam un pēc atlases tiek nodota lietotājam. Praksē tas tā nav. Piemēram, pašreizējie tiešsaistes bibliotēku katalogi parasti ierobežo meklēšanu līdz dažiem laukiem: autors, nosaukums un subtitri skatā, kurā ir citi lauki, kas netiek meklēti. Tas ir pietiekams iemesls, kāpēc ir nepieciešams atšķirtskats un meklēšanas rādītājs, kas ir skata meklēšanas daļa. Tas nosaka visu, kam jābūt meklējamam. Meklējamu indeksu, piemēram, skatu un avota objektu, var sadalīt atsevišķos apakšindeksos, lai nodrošinātu precīzāku, mērķtiecīgāku meklēšanu
Meklētājprogrammām parasti ir iekšēji sintētiska struktūra, kas nodrošina atbilstību derīgiem meklēšanas rezultātiem. Šī struktūra ir meklējamā indeksa otrais komponents.
Procesuāli indeksēšanas procesu var īstenot dažādos veidos: meklējamo indeksu var iegūt, izmantojot:
- burtiski kopē meklējamo attēlojumu;
- kopējot skata informāciju. Tas var būt daļa vai visi skati, kas fiziski pastāv tikai kā fragmenti, kas izplatīti saskaņā ar meklēšanas indeksa izveides noteikumiem, kas tiks apkopoti, kad nepieciešams.
Pieprasījuma noformēšanas noteikumi un oficiālie pieprasījumi
Vaicājumu inženierija ir funkcija, kas ir starpnieks starp lietotāja vaicājumu un formālu vaicājumu. Tas pārveido lietotāja vaicājumu, saskaņojot to ar izguves komandu vārdnīcām, indeksa specifikāciju un indeksu pirms izguves. IPS attīstības rītausmā šī loma tradicionāli tika uzticēta kvalificētiem IT speciālistiem.
Datora vaicājumu izstrāde, kas var saskaņot vārdnīcas vaicājumus meklēšanas indeksu sistēmā, parasti tiek saukta par "vārdnīcas ievades" moduli. Šīs funkcijas automatizācija ir daudzsološa un piedāvā iespējas ekspertu un varbūtības meklēšanas metodēm.
Formāls pieprasījums kļūst par oficiālu pieprasījumu pēc lietotāja pieprasījuma konvertēšanas. Šādu formālu transformāciju piemēri ir saīsināšana, aizstāšana, normalizācija, vektorizācija un citas "ārējās" reprezentācijas transformācijas datora IPS (atšifrēšanas - informācijas izguves sistēmas) "iekšējos" attēlojumos.
Izvilktas dokumentu saišu kopas
Iegūtā informācijas avotu kopa loģiski ir skatu apakškopa, kas izveidota, izmantojot atbilstības kārtulas, kas tiek piemērotas oficiālajam vaicājumam ar meklējamo indeksu.
Parasti, bet ne obligāti, ir atsevišķs atkoptās informācijas kopas kārtošanas process. Tiešsaistes bibliotēku katalogi pirms parādīšanas parasti pārkārto saņemtās kopas pēc autora alfabētiskā secībā. Informācijas izguves sistēmās, kas veido stingru klasifikāciju, ranžēšanas secība ir pirms jebkādas pārkārtošanas.
Izvades straumes
Meklēšanas rezultātu izvadīšana tiek veikta tradicionāli displejā, biežāk citur vai kādam citam nolūkam izmantojamu objektu plūsmas veidā, pabeidz galveno meklēšanas cilpu. Šādas straumes var nosūtīt uz vizualizācijas ierīcēm, uzglabāšana turpmākai apstrādei vai izmantošana kā ievades straumes citos atlases pakalpojumos.
Informācijas izguves sistēmas nodrošina atgriezenisko saiti nojebkura atlases procesa rezultāts. Jebkura procesa rezultāts var būt atgriezeniskā saite citiem procesiem. Atsauksmes var būt par pamatu eksperta spriedumam jebkurā posmā.
Ieteicams:
Kas ir informācijas bizness? Informācijas bizness no A līdz Z
Šodien informācijas bizness pelnīti tiek uzskatīts par vadošo resursu sabiedrības attīstībai. Ļaujiet mums sīkāk apsvērt, kā un uz ko šī darbība ir balstīta
Kā veikt pāreju uz vienkāršoto nodokļu sistēmu: soli pa solim instrukcijas. Pāreja uz vienkāršoto nodokļu sistēmu: PVN atgūšana
IP pāreja uz vienkāršoto nodokļu sistēmu tiek veikta likumā noteiktajā kārtībā. Uzņēmējiem jāvēršas dzīvesvietas nodokļu iestādē
Informācijas un uzziņu sistēma: veidi un piemēri. Kas ir informācijas un atsauces sistēma?
Informācijas izplatīšana, tās tālāka vākšana un apstrāde mūsdienu sabiedrībā notiek, pateicoties īpašiem resursiem: cilvēkresursiem, finanšu, tehniskajiem un citiem. Kādā brīdī šie dati tiek apkopoti vienuviet, strukturēti pēc iepriekš noteiktiem kritērijiem, apvienoti īpašās lietošanai ērtās datubāzēs
Informācijas dēlis: mērķis un ražošana
Informācijas dēļi un stendi izvietoti dažādās vietās. Ar tiem jūs varat viegli izplatīt reklāmas vai vienkārši reklāmas. Tāpēc tie tiek novietoti autobusu pieturās un citās sabiedriskās vietās
Vai man ir nepieciešams kases aparāts individuālajiem uzņēmējiem ar vienkāršoto nodokļu sistēmu? Kā reģistrēt un lietot kases aparātu individuālajiem uzņēmējiem saskaņā ar vienkāršoto nodokļu sistēmu?
Rakstā ir aprakstītas naudas līdzekļu apstrādes iespējas bez kases aparātu līdzdalības (CCT)