Fontoj de Grandaj Datumoj en Medicino

by Kevin Hwang, MD, MPH; Reviziita de Richard N. Fogoros, MD

Simpla difino pri grandaj datumoj en medicino estas "la totalo de datumoj rilatigitaj kun pacienca sano kaj bonstato" (Raghupathi 2014). Sed kia estas ĉi tiuj specoj de datumoj, kaj de kie ili venas?

La sekvantaro estas larĝa superrigardo pri la tipoj kaj fontoj de grandaj datumoj de intereso al sanproprizorgantoj, esploristoj, pagantoj, politikistoj kaj industrio.

Ĉi tiuj kategorioj ne estas reciproke ekskluzivaj, ĉar la samaj datumoj povas deveni de diversaj fontoj.

Nek ĉi tiu listo estas ĝisfunda, ĉar la praktika apliko de grandaj datumoj analitike verŝajne daŭrigos.

Klinikaj Informaj Sistemoj

Ĉi tiuj estas tradiciaj fontoj de klinikaj datumoj, kiujn la sanaj provizantoj kutimas rigardi.

Elektronikaj sanaj rekordoj (EHRs) kolektas, konservas kaj montras informojn kiel ekzemple demografio, pasinta medicina historio, aktivaj kuracaj problemoj, imunigoj, alergioj, kuraciloj, esencaj signoj, rezultoj de laboratorio kaj radiologiaj provoj, patologiaj raportoj, progresaj notoj kreitaj de sano provizantoj kaj administraj kaj financaj dokumentoj
Elektronikaj medicinaj registroj (EMRs) ne estas identaj al EHRs kaj kutime apartenas al datumoj stokitaj kun aparta kuracisto.
La interŝanĝoj de sano-informoj servas kiel hubs inter malsimilaj klinikaj informaj sistemoj

Pacientaj registroj, konservitaj de sanaj organizaĵoj en siaj propraj pacientoj, ofte estas ligita al la EHR. Aliaj registroj spuras inmunizojn, kanceron, traŭmatojn kaj aliajn publikajn aferojn pri pli ampleksa geografia skalo.

Pacientaj portaloj permesas al pacientoj aliri personajn sanajn informojn stokitajn en EHR de sanitara organizo. Kelkaj paciencaj portaloj ankaŭ permesas al la uzantoj peti preskribojn kaj interŝanĝi sekretajn elektronikajn mesaĝojn kun la sano-teamo.

Keloj de klinikaj datumoj entute datiĝas de pacienca nivelo de multaj klinikaj informaj sistemoj, kiel EHRs kaj aliaj fontoj listigitaj supre

Petas Datumon de Pagantoj

Publikaj pagantoj (ekz. Medicare) kaj privataj pagantoj havas grandajn repositoriojn de reklamprezentaj datumoj pri siaj profitigantoj. Kelkaj sanaj asekuristoj nun ankaŭ proponas stimulojn por dividi viajn sanajn datumojn.

Esploroj de Esploro

Esploraj datumbazoj enhavas informojn pri studaj partoprenantoj, eksperimentaj traktadoj kaj klinikaj rezultoj. Grandaj studoj kutime estas sponsoritaj de farmaciaj kompanioj aŭ registaraj agentejoj. Apliko de personecigita medicino estas kunigi individuajn pacientojn kun efikaj traktadoj, bazitaj sur ŝablonoj en klinikaj provoj-datumoj.

Ĉi tiu alproksimiĝo moviĝas preter aplikado de evidentecaj medicinaj principoj, per kiu kuracisto provizas ĉu paciento dividas larĝajn trajtojn (ekz. Aĝo, sekso, raso, klinika statuso) kun juĝaj partoprenantoj. Kun grandaj analizaj datumoj, ĝi eblas elekti traktadon bazitan sur multe pli multekula informo, kiel ekzemple la genetika profilo de kancero de paciento (vidu sube).

Klinikaj decid-subtenaj sistemoj (CDSS) ankaŭ evoluis rapide kaj nun reprezentas grandan parton de artefarita inteligenteco (AI) en medicino.

Ili uzas paciencajn informojn por helpi klinikistojn per sia decido kaj ofte kombinas ilin kun EHRs.

Genetikaj datumbazoj

La repositorio de homa genetika informo daŭre amasigas rapide. Pro tio ke la Homa Genoma Projekto estis kompletigita en 2003, la kosto de homa sekvencado de ADN malpliiĝis milionoble. La Persona Projekto Genoma (PGP), lanĉita en 2005 fare de Harvard Medical School, serĉas sekvencon kaj publikigon de la kompletaj genomoj de 100,000 volontuloj de ĉiuj. La PGP mem estas unua ekzemplo de granda datuma projekto pro la plej granda volumo kaj vario de datumoj.

Persona genoma enhavas ĉirkaŭ 100 gigabajtojn da datumoj. Aldone al sekvencado de genomoj, la PGP ankaŭ kolektas datumojn de EHRs, enketoj, kaj mikrobiomaj profiloj.

Kelkaj kompanioj proponas rektan-konsumantan genetikan sekvencon por sano, personaj trajtoj kaj farmacogenetiko komerce.

Ĉi tiu persona informo povus esti submetita al grandaj datumaj analizoj. Ekzemple, 23 kaj mi ĉesis proponi rilatojn pri sano rilatigitaj al novaj klientoj la 22-an de novembro 2013, por plenumi la Usonan Manĝaĵon kaj Drugministradon. Tamen, en 2015, la kompanio komencis oferti iujn sanajn komponantojn de sia genetika saliva provo denove, ĉi-foje kun la aprobo de la FDA.

Publikaj Rekordoj

La registaro konservas detalajn registrojn pri eventoj rilatigitaj al sano, kiel enmigrado, geedzeco, naskiĝo kaj morto. La usona Censo kolektis grandajn kvantojn da informoj ĉiun 10 jarojn ekde la jaro 1790. La statistika retejo de la Censo havis 370 miliardojn da ĉeloj de 2013, kun proksimume 11 miliardoj pli aldonitaj ĉiujare.

TTT-serĉoj

Reteja serĉo-informoj kolektitaj de Google kaj aliaj retejaj provizantoj povus provizi realtempajn informojn rilate al la sano de la loĝantaro. Tamen, la valoro de grandaj datumoj de TTT-serĉaj ŝablonoj povus esti plibonigita kombinante ĝin kun tradiciaj fontoj de sanaj datumoj.

Socia Duona

Facebook, Twitter kaj aliaj sociaj amaskomunikiloj platformoj generas riĉan varion de datumoj ĉirkaŭ la horloĝo, donante vidpunkton al la lokoj, sanaj kondutoj, emocioj kaj sociaj interagoj de uzantoj. La apliko de sociaj amaskomunikiloj granda datumo al publika sano estis nomata cifereca malsano detekto aŭ cifereca epidemiologio. Twitter, ekzemple, estis uzita por analizi epidemiojn de gripo inter la ĝenerala populacio.

La Monda Bonega Projekto, kiu komencis en la Universitato de Pensilvanio, estas alia ekzemplo pri studado de sociaj amaskomunikiloj por kompreni la sperton de homoj kaj pli bonan sanon. La projekto kunigas psikologojn, statistikistojn kaj komputikajn sciencistojn, kiuj analizas lingvon uzatan interaktante interrete, ekzemple, kiam ili skribas statusajn ĝisdatigojn en Facebook kaj Twitter. Scienculoj observas, kiel la lingvo de la uzantoj rilatas sian sanon kaj feliĉon. Avancoj en natura lingvo-pretigo kaj maŝina lernado helpas per siaj klopodoj. Freŝa publikigado de la Universitato de Pensilvanio rigardis manierojn antaŭdiri mensan malsanon analizante sociajn amaskomunikilarojn. Ŝajnas, ke simptomoj de depresio kaj aliaj mensaj sanaj kondiĉoj povas esti detektitaj per studado de nia uzo de interreto. Sciencistoj esperas en la estonteco ĉi tiuj metodoj kapablas pli bone identigi kaj helpi ĉe riska individuoj.

Interreto de Aferoj (IoT)

Multaj ekspluatadoj pri sano-informoj ankaŭ kolektas kaj stokas en moveblaj kaj hejmaj aparatoj .

Smartphones : Miloj da mHealth-apps kaptas informojn pri la fizika agado de la uzanto, nutraĵa ingestaĵo, dormaj mastroj, emocioj kaj aliaj parametroj. Indiĝenaj poŝtelefonoj (ekz. GPS, retpoŝto, tekstado) povas ankaŭ doni aŭtoveturejojn pri la sano-statuso de individuo.
Monitoroj kaj mekanismoj: Pedometroj, acelerómetros, gafas, horloĝoj kaj blatoj integritaj sub la haŭto ankaŭ kunvenas informojn de sano kaj ili ankaŭ povas sendi ilin al la nubo.
Telemedikinaj aparatoj permesas al sanaj provizantoj monitori la parametrojn de pacientoj kiel sangopremo, koraj impostoj, spira ritmo, oksigeneco, temperaturo, ECG-trakadoj kaj pezo.

Financaj Transakcioj

La transakcioj de kreditkartoj de pacientoj estas inkluzivitaj en la prognozaj modeloj uzataj de Carolinas HealthCare System por identigi pacientojn, kiuj havas grandan riskon por esti senditaj al la hospitalo. La provizoro de sano bazita en Charlotte uzas grandajn datumojn por dividi pacientojn en diversajn grupojn, ekzemple, surbaze de malsano kaj geografia loko.

Etikaj kaj Privateca Implikoj

Oni devas reliefigi, ke en iuj kazoj, eble gravaj etikaj kaj privataj implikaĵoj kolektu kaj alirante datumojn en sano. Novaj fontoj de grandaj datumoj povas plibonigi nian komprenon pri la efikoj de individuoj kaj de la sano de la loĝantaro, tamen malsamaj riskoj devas esti zorgeme konsideritaj kaj monitoritaj. Ĝi nun ankaŭ rekonis, ke la datumoj antaŭe opiniis anonimaj, povas esti ree identigitaj. Ekzemple, Profesoro Latanya Sweeney de Harvard's Data Private Lab reviziis 1,130 volontulojn okupitajn en la Propra Genoma Projekto. Ŝi kaj ŝia teamo povis korekte nomi 42 procentojn de la partoprenantoj bazitaj sur la informoj, kiujn ili dividis (ZIP kodo, naskiĝtago, sekso). Ĉi tiu scio povas pliigi nian konscion pri eblaj riskoj kaj helpi nin fari pli bonajn datumajn decidojn.

> Fontoj:

> Conway M, O'Connor D. Sociaj amaskomunikiloj, grandaj datumoj kaj mensa sano: nunaj antaŭas kaj etikaj implikaĵoj. Nuna opinio en Psikologio 2016; 9: 77-82.

> Fernandes L, O'Connor M, Weaver V. Grandaj datumoj, pli grandaj rezultoj. Journal of The American Health Information Management Association ( 2012): 83 (10): 38-43

> Guntuku S, Yaden D, Kern M, Ungar L, Eichstaedt J. Detektanta depresion kaj mensan malsanon pri sociaj amaskomunikiloj: integra revizio . Aktuala opinio pri kondutoj pri sciencaj sciencoj 2017; 18: 43-49.

> Lazer D, Kennedy R, King G, Vespignani A. La Parabolo de Google Flu: Kaptiloj en Big Data Analysis . Scienco 2014; 343 (6176): 1203-1205.

> Raghupathi W, Raghupathi V. Grandaj datumoj analitikoj en sano: promeso kaj potenti al. Sano-Informo-Scienco kaj Sistemoj 2014; 2: 3

> Sweeney L, Abu A, Winn J. Identigante partoprenantojn en la Projekto de Persona Genoma per Nomo . Universitato Harvard. Datumoj Privata Laboro. Blanka Papero 1021-1. 24an de aprilo 2013.