16 -->
Kultūras zinātne Ļevs Manovičs „Nākamā lielā ideja valodas, vēstures un mākslu jomā? Dati.”
New York Times, 2010, November 16 |
| Šogad savā 15 gadu jubilejā RIXC ikgadējais festivāls maina nosaukumu un kursu – no 90. gadu interneta kultūras un „māksla plus komunikācija” idejām tas veic pagriezienu uz plašākiem mākslas un zinātnes laukiem, manifestējot postmediju situāciju un risinot ilgtspējības jautājumus.
RIXC festivāla laikā līdz 22. novembrim „kim?” laikmetīgās mākslas centrā ir aplūkojama izstāde „Datu sanesas” (Data Drift).
Šogad viens no RIXC festivāla galvenajiem viesiem ir Ļevs Manovičs no ASV, grāmatas „Jauno mediju valoda” (Rīga: RIXC, 2006) autors, Software Studies Initiative dibinātājs, kas 2014. gadā atzīts par vienu no 50 interesantākajiem nākotnes veidotājiem. Ļevs Manovičs ir arī izstādes „Datu sanesas” kurators kopā ar Rasu Šmiti un Raiti Šmitu. Kuratori uzskata, ka glezniecība ir klasiskā laikmeta māksla un fotogrāfija – modernā laikmeta māksla, tādēļ datu vizualizācija ir mūsu tīklotā digitālā laikmeta māksla.
Izstāde „Datu sanesas” rāda darbus, ko radījuši mūsu laika ietekmīgākie datu dizaineri, kā arī mākslinieki, kuri datus izmanto kā mākslas mediju. Kā mēs varam izmantot datu mediju, lai atspoguļotu mūsu komplicētās sabiedrības un nokļūtu viņpus tik vienkāršotām kategorijām kā „vispopulārākais” un „visvairāk patīk”? Kā mēs varam organizēt „datu sanesas”, kas strukturē mūsu dzīves, lai atklātu to jēgu un skaistumu? Kā izmantot „lielos datus”, lai varam ieraudzīt pagātni un tagadni neparastāku un svaigāku?
Vairāk informācijas: rixc.org
Rasa Šmite |
| Brodveja tiek attēlota kā Ņujorkas „mugurkauls”, vizualizējot dažādus datus no mājsaimniecību gada ienākumiem līdz taksometru izsaukumiem un Twitter ziņām |
| 2005. gadā es atskārtu, ka milzīgie informācijas apjomi, ko ģenerē interneta lietotāji, tāpat kā vēsturisko artefaktu digitalizēšana, rada jaunas iespējas kultūras jomu pētniecībā. 2007. gadā mēs nodibinājām pētniecības laboratoriju (Software Studies Initiative; softwarestudies.com), lai sāktu darbu pie praktiskiem projektiem. Šajā rakstā es minēšu piemērus tiem teorētiskajiem un praktiskajiem jautājumiem, kas bija mūsu darba dzinulis. Ko tas īsti nozīmē – reprezentēt kultūru ar datu palīdzību? Kādas unikālas iespējas piedāvā liela apjoma kultūrdatu datorizēta apstrāde salīdzinājumā ar kvalitatīvajām metodēm, ko izmanto humanitārās un sociālās zinātnes. Un kā datoranalīze ļauj ņemt vērā kultūras artefaktu un procesu variabilitāti (mainīgumu) un dažādību, nevis fokusēties vienīgi uz „tipisko” un „vispopulārāko”?
Tagad, pēc astoņiem gadiem, mūsu laboratorijas darbs ir kļuvis tikai par niecīgu daļu no ļoti lielā pētījumu apjoma. Tūkstošiem pētnieku jau publicējuši desmitiem tūkstošus darbu, kuros analizētas masīvu kultūras datu kopu struktūras. Pirmkārt, tie ir dati, kas atspoguļo vispopulārāko sociālo tīklu (Flickr, Instagram, YouTube, Twitter u. c.) darbību, lietotāju ģenerēta informācija, ar ko tie dalās šajās vietnēs (tvīti, attēli, video u. c.), kā arī lietotāju mijiedarbība ar šo informāciju (opcijas „patīk”, „mana izvēle”, „dalīties”, „komentēt”). Otrkārt, pētnieki sākuši analizēt arī atsevišķas profesionālās kultūras jomas un vēsturiskos periodus, piemēram, tīmekļa vietnes dizainu, modes fotogrāfiju, 20. gadsimta populāro mūziku, 19. gadsimta literatūru utt. Šī pētniecība notiek divos jaunradītos darbības laukos – sociālajā datorikā un digitālajās humanitārzinātnēs.
Digitālo humanitārzinātņu pētnieki izmanto datorus, lai analizētu galvenokārt profesionāļu radītos vēsturiskos artefaktus. Kā piemēru var minēt romānus, ko sarakstījuši profesionāli rakstnieki 19. gadsimtā. Perioda izvēli nosaka vēsturiskās robežas, ko definējis autortiesību likums attiecīgajā valstī. Piemēram, Amerikas Savienotajās Valstīs darbus, kas publicēti pēdējo 95 gadu laikā, automātiski aizsargā autortiesību likums. (Tādējādi, rēķinot no 2015. gada, autortiesības skar visu, kas radīts pēc 1920. gada, ja vien konkrētais darbs nav definēts kā digitalizēts saturs, uz kuru attiecas organizācijas Creative Commons licence.) Es saprotu cieņu pret autortiesību likumiem, taču tas nozīmē, ka digitālo humanitārzinātņu pārstāvji liedz sev iespēju pētīt šodienas informāciju.
Sociālās datorikas lauks ir tūkstošiem reižu lielāks. Šeit augsta līmeņa datorzinātņu speciālisti pēta tiešsaistē radītu lietotāju informāciju, kā arī mijiedarbību ar to. Te jāņem vērā, ka ar šo pētniecības jomu nodarbojas ne tikai datorzinātnieki un informātikas speciālisti, kas profesionāli sevi pieskaita sociālās datorikas laukam1, bet arī pētnieki no citām datorzinātņu jomām, piemēram, Computer Multimedia (datormultimediji), Computer Vision (datorvīzija), Music Information Retrieval (mūzikas informācijas izguve), Natural Language Processing (dabiskā valodas apstrāde), Web Science (tīmekļa zinātne). Šī iemesla dēļ sociālo datoriku var izmantot kā jumta apzīmējumu visai datorzinātņu pētniecībai, kas analizē sociālo tīklu saturu un darbību. Pētniecības laukā ir dati pēc 2004. gada, kad sociālie tīkli un multivides koplietošanas pakalpojumu sniedzēji sāka kļūt populāri. (Tā kā izpētes veikšanai un rezultātu publicēšanai nepieciešami 1–2 gadi, 2015. gada pētījumu publikācija būs balstīta uz 2012.–2014. gadā iegūtiem datiem.) Šīs datu kopas parasti ir arī daudz lielākas nekā tās, ko izmanto digitālās humanitārzinātnes. Nereti tie ir desmitiem vai simtiem miljonu iesūtņu, fotogrāfiju vai cita veida informācijas. Tā kā absolūti lielāko daļu šīs informācijas ģenerē vienkāršie cilvēki, nevis profesionāļi, ir skaidrs, ka sociālā datorika pēta neprofesionālo, ikdienas kultūru.
Humanitāro zinātņu un mākslu praktiķiem, kam var nebūt priekšstata par to, cik daudz cilvēku darbojas datorzinātņu un ar tām saistīto jomu laukā, šī pētījuma mērogs var šķist pārsteidzošs. Piemēram, Google Scholar meklētājprogramma pieprasījumam „Twitter datu kopu algoritmi” izdeva 102 000 dokumentus, pieprasījumam „YouTube video datu kopas” – 27 800 dokumentus, bet pieprasījumam „Flickr attēlu algoritmi” – 17 400 dokumentus.2
Meklējot „skaitļošanas estētikas datu kopu”, ieguvu 14 100 rezultātus.3 Pat ja konkrētie skaitļi ir daudz mazāki, tie tomēr ir iespaidīgi. Protams, ne jau visi no piedāvātajiem dokumentiem aplūko ar kultūru saistītus jautājumus, taču daudzi ir tiem veltīti.
Aplūkojot daudzos datorzinātņu referātu piemērus, redzams, ka tie balstīti uz humanitārās jomas un komunikācijas studiju (Communication Studies) pētniecību (attiecībā uz mūsdienu medijiem), tikai daudz plašākā mērogā. Piemēram, dažas no nesenām publikācijām: Quantifying visual preferences around the world („Vizuālo preferenču kvantitatīvie rādītāji pasaulē”) un What we Instagram: A first analysis of Instagram photo content and user types („Ko mēs liekam Instagram: Instagram foto satura un lietotāju tipu pirmā analīze”).4 Pirmais pētījums analizē pasaulē populārākās tīmekļa dizaina izvēles, balstoties uz 2,5 miljoniem atbilžu, ko snieguši 40 000 cilvēku no 179 valstīm. Estētika un dizains tradicionāli tiek pieskaitīti humanitārajai jomai. Otrais pētījums veltīts visbiežāk sastopamajām tēmām Instagram fotogrāfijās – tas ir temats, ko var salīdzināt ar mākslas zinātnes pētījumu par žanriem 17. gadsimta holandiešu mākslā.
Vēl viens piemērs ir referāts What is Twitter, a social network or a news media? („Kas ir Twitter, sociāls tīkls vai ziņu medijs?”).5 Kopš tā publicēšanas 2010. gadā tas jau 3284 reizes ir citēts citās datorzinātnēm veltītās publikācijās. Tā bija pirmā plaša mēroga analīze par Twitter sociālo tīklu, kas bija balstīta uz 106 miljoniem tvītu no 41,7 miljoniem lietotāju. Pētījumā īpaša uzmanība veltīta populārām jeb modes tēmām, parādot, „kādās kategorijās šīs modes tēmas klasificējamas, cik ilgs ir šo tēmu mūžs un cik daudz tām lietotāju”. Šis ir klasisks komunikācijas studiju jautājums, kas liek atcerēties pirmo šādu darbu, ko veica Pauls Lācarsfelds (Paul Lazarsfeld) kopā ar kolēģiem: 20. gs. 40. gados viņi manuāli saskaitīja radio raidījumu tēmas. Tomēr, ņemot vērā, ka Twitter un citas mikroblogu pakalpojumu vietnes pārstāv jaunu mediju formu – tāpat kā savulaik gleznošana eļļas tehnikā, grāmatu iespiešana un fotogrāfija –, izpratne par Twitter kā medija specifiku arī ir tēma, kas attiecas uz humanitāro jomu.
Neliela daļa publikāciju pieder pie starpzonas, kurā pārklājas digitālo humanitārzinātņu un sociālās datorikas jomas. Tajās izmantotas skaitļošanas metodes un algoritmi, ko izveidojuši datorzinātnieki, lai pētītu mūsdienu lietotāju radītu informāciju un medijus, kā arī lai piemērotu tās darbam ar vēsturiskiem artefaktiem, kurus radījuši profesionāļi (t. i., profesionāli mākslinieki, rakstnieki, redaktori, mūziķi vai filmu veidotāji). Starp redzamākajiem piemēriem var minēt Toward automated discovery of artistic influence („Pretī automatizētai mākslinieciskās ietekmes atklāšanai”)7, Infectious texts: Modeling text reuse in nineteenth-century newspapers („Lipīgie teksti: Teksta atkārtotas izmantošanas modelēšana 19. gadsimta laikrakstos” (Deivids A. Smits,
Raiens Kordels un Elizabete Medoka Dilona, 2013))8, Measuring the evolution of contemporary Western popular music („Mūsdienu Rietumu populāras mūzikas evolūcijas novērtēšana” (Žuans Serrā, Alvaro Korrals, Marians Boguņā, Martins Aro un Žuzeps Arkoss, 2012))9 un Quicker, faster, darker: Changes in Hollywood film over 75 years („Ātrāk, straujāk, tumšāk: Holivudas kino pārmaiņas 75 gadu laikā” (Džeimss Katings, Kaitlina Brunika, Džordans Delongs, Katalina Iričinska, Aiše Džandana, 2011)).10
|
| |
| Līdz pat nesenam laikam vienīgais projekts, kas analizēja kultūras vēsturi patiešām lielā mērogā, izmantojot miljoniem tekstu, bija zinātnieku, nevis humanitārās jomas pārstāvju darbs. Es šeit runāju par N-Gram Viewer, ko 2010. gadā radīja Google pētnieki Jons Orvants un Vils Brokmans, sekojot divu Hārvarda universitātes aspirantu paraugam, kas bija veikuši pētījumu bioloģijas un pielietojamās matemātikas jomā. Tomēr pēdējā laikā varam vērot, kā digitālo humanitārzinātņu speciālisti ievērojami palielina pētāmo datu apjomu. Piemēram, pētījumā Mapping mutable genres in structurally complex volumes („Mainīgo žanru kartēšana strukturāli kompleksos sējumos”) literatūras pētnieks Teds Andervuds un viņa kolēģi izanalizēja 469 200 elektroniskās bibliotēkas Trust Digital Library sējumus.11 Mākslas zinātnieks Maksimilians Šihs kopā ar kolēģiem izpētīja 120 000 ievērojamu vēsturisku personību dzīves gājumu (A network framework of cultural history („Kultūras vēstures tīkla ietvari”)).12 Vēl lielākas vēsturisko datu kopas ir kļuvušas pieejamas literatūras, fotogrāfijas, kino un TV jomā – tās joprojām gaida izpēti. 2015. gadā HathiTrust nodeva lietošanā, padarot pieejamus pētniecībai, datus no 4 801 237 sējumiem (kopumā 1,8 miljardus lappušu).13 Tajā pašā gadā The Associated Press un British Movietone augšupielādēja YouTube serverī 550 000 digitalizētus ziņu laidienus, kas aptver laikposmu no 1895. gada līdz mūsdienām.14
Kāpēc ir svarīgi, lai mums būtu pieejamas šādas lielas kultūras datu kopas? Kāpēc gan mēs nevaram izmantot mazāka apjoma avotus? Manuprāt, te ir vairāki iemesli. Pirmkārt, lai iegūtu reprezentējošu paraugu, mums nepieciešams daudz lielāks informācijas apjoms vai vismaz izpratne par to, kas ietilpst šajā lielākajā apjomā. Tā, piemēram, ja vēlamies iegūt reprezentējošu 20. gadsimta filmu paraugu, varam izmantot IMDb (interneta filmu datubāzi), kurā iekļauta informācija par 3,4 miljoniem filmu un TV šovu (ieskaitot atsevišķas epizodes).15 Tāpat mēs varam iegūt labu vēsturiskas ASV laikraksta lapas paraugu, izmantojot vēsturisko Amerikas laikrakstu kolekciju, kurā ietilpst miljoni digitalizētu avīžu lapu un kura pieejama Kongresa bibliotēkā.16 Tomēr daudzās citās kultūras jomās šādas lielas datu kopas vienkārši neeksistē, bet bez tām nav iespējams iegūt reprezentējošus paraugus.
Un otrs iemesls. Pieņemot, ka spējam konstruēt kādu kultūras jomu reprezentējošu paraugu, mēs to varam izmantot arī, lai atrastu vispārējas tendences un modeļus. Piemēram, jau minētajā referātā „Ko mēs liekam Instagram: Instagram foto satura un lietotāju tipu pirmā analīze”17 trīs datorzinātņu speciālisti izanalizēja 1000 Instagram fotogrāfijas un tādējādi atlasīja astoņas visbiežāk izmantotās kategorijas (pašiņi, draugi, mode, ēdiens, ierīces, nodarbošanās, mājdzīvnieki, titrēti foto). Šie 1000 foto bija gadījuma atlase no lielāka fotogrāfiju apjoma, ko tīmeklī bija ievietojuši 95 343 lietotāji. Iespējams, šīs astoņas kategorijas arī bija vispopulārākās starp visiem Instagram foto, kas koplietoti tīmeklī laikā, kad zinātnieki veica pētījumu.
Tomēr, strādājot pie citiem projektiem, kuru laikā mēs analizējām Instagram fotogrāfijas dažādās pilsētās un to daļās (piemēram, Kijevas centrā Ukrainas 2014. gada revolūcijas laikā pētījumā The exceptional and the everyday („Ārkārtējais un ikdienišķais”)18), bija redzams, ka cilvēki dalās arī ar daudzu citu tēmu fotogrāfijām. Atkarībā no ģeogrāfiskās vietas un laika dažas no šīm tēmām pat var pārspēt popularitātē minētās astoņas kategorijas. Citiem vārdiem, kaut arī neliela apjoma paraugs ļauj atrast „tipisko” un „vispopulārāko”, tas neatklāj to, ko es saucu par „saturiskajām salām”, – vienota satura datu apjomus ar īpašām semantiskām un / vai estētiskām īpašībām, ar kuriem dalās mērens skaits dalībnieku.
Tieši tādēļ ideālā variantā mums vajadzētu aplūkot visu, ko rada visi, vai vismaz būtu jātiecas pēc šāda ideāla. Tikai tad mēs varētu padarīt kultūras pētniecību patiesi demokrātisku un būt pārliecināti, ka mūsu uzmanības centrā nav vienkārši „tipiskais” un „vispopulārākais”.
No angļu valodas tulkojusi Iveta Boiko
1 Sk. konferenču programmas attiecīgajās jomās un tēmu loku, ko tās aptver, piemēram: cscw.acm. org/2016/submit/; www.www2015.it/accepted-papers/.
2 https://scholar.google.com
3 Turpat.
4 Reinecke, Katharina. Gajos, Krzysztof Z. Quantifying visual preferences around the world. In: Proceedings of the SIGCHI Conference on Human Factors in Computing Systems. New York: ACM, 2014, p. 11–20. Pieejams: www. eecs.harvard.edu/~kgajos/papers/2014/reinecke14visual.pdf; Hu, Yuheng. Manikonda, Lydia. Kambhampati, Subbarao. What we Instagram: A first analysis of Instagram photo content and user types. In: Proceedings of the 8th International AAAI Conference on Weblogs and Social Media. Palo Alto: The AAAI Press, 2014. Pieejams: rakaposhi.eas.asu.edu/instagram-icwsm.pdf.
5 Kwak, Haewoon. Lee, Changhyun. Park, Hosung. Moon, Sue. What is Twitter, a social network or a news media? In: Proceedings of the 19th International World Wide Web (WWW) Conference. New York: ACM, 2010, p. 591–600; Pieejams: www.eecs.wsu.edu/~assefaw/ CptS580-06/papers/2010-www-twitter.pdf.
6 https://scholar.google.com/ citations?user=M6i3Be0AAAAJ&hl=en
7 Saleh, Babak. Abe, Kanako. Arora, Ravneet Singh. Elgammal, Ahmed. Toward automated discovery of artistic influence. Multimedia Tools and Applications, 19 August 2014 (Springer), p. 1–27. Pieejams: arxiv.org/abs/1408.3218.
8 Smith, David A. Cordell, Ryan. Dillon, Elizabeth Maddock. Infectious texts: Modeling text reuse in nineteenth-century newspapers. In: Proceedings of 2013 IEEE Conference on Big Data. Pieejams: www.ccs. neu.edu/home/dasmith/infect-bighum-2013.pdf.
9 Serrà, Joan. Corral, Álvaro. Boguñá, Marián. Haro, Martín. Arcos, Josep Ll. Measuring the evolution of contemporary Western popular music. Nature Scientific Reports 2, article number: 521, 2012. Pieejams: www.nature.com/articles/srep00521.
10 Cutting, James E. Brunick, Kaitlin L. DeLong, Jordan. Iricinschi, Catalina. Candan, Ayse. Quicker, faster, darker: Changes in Hollywood film over 75 years. i-Perception, Vol. 2, No. 6, 2011, p. 569–576. Pieejams: people.psych.cornell.edu/~jec7/pubs/ iperception.pdf.
11 Underwood, Ted. Black, Michael L. Auvil, Loretta. Capitanu, Boris. Mapping mutable genres in structurally complex volumes. In: Proceedings of the 2013 IEEE Conference on Big Data. Pieejams: arxiv.org/abs/1309.3323.
12 Schich, Maximilian. Song, Chaoming. Ahn, Yong-Yeol. Mirsky, Alexander. Martino, Mauro. Barabási, Albert-László. Helbing, Dirk. A network framework of cultural history. Science, 1 August 2014, p. 558–562. Pieejams: www.uvm.edu/~cdanfort/csc-reading-group/ schich-science-2014.pdf.
13 https://sharc.hathitrust.org/features. Skatīts 20.08.2015.
14 www.ap.org/content/press-release/2015/ap-makes-one- million-minutes-of-history-available-on-youtube
15 Stats. IMDb. Skatīts 10.08.2015.
16 chroniclingamerica.loc.gov/about/
17 Hu, Yuheng. Manikonda, Lydia. Kambhampati, Subbarao. What we Instagram: A first analysis of Instagram photo content and user types.
18 Manovich, Lev. Yazdani, Mehrdad. Tifentale, Alise. Chow, Jay. The exceptional and the everyday: 144 hours in Kyiv (2014). Pieejams: www.the-everyday.net/. |
| Atgriezties | |
|