El lapo azul (2).

Después de haberme dedicado intensivamente, a distancia de e-mail,  con mi conocido este finde a estos temas sobre los que hemos hablado en la anterior entrada, quiero hacer un breve balance:

1. La gran ventaja de la genealogía genética es lo sorprendente y divertida que es. Hacía tiempo que no me reía tanto. Espero que nunca salgan a la luz los cientos de comentarios que hemos intercambiado por e-mail. El cashondeo no es siempre políticamente correcto…

Ojo, aunque los resultados de estos test son, en principio (luego hablaremos de los posibles problemas de identificación) 100% fiables, conviene no tomarse estas cosas muy en serio. El que se los tome así puede tener serios problemas de identidad, según lo que le salga (pienso, por ejemplo, en algún consumidor que se haya creído las genealogías legendarias o que le de demasiada importancia a la genealogía histórica o documental)🙂. Aunque es claramente pueril preferir una linea a otra, como en el fondo somos unos niños, la posición psicológica más adecuada antes de hacerse el test es no tener grandes preferencias a-priori: lo que le salga a uno, es lo mejor y punto. Y la verdad es que en cualquier linea humana en la que uno pueda pensar es fácil encontrar cosas admirables. Por otra parte ¿ no es mejor concentrar energía en que la gente del futuro quiera compartir segmentos genéticos con uno (esto significaría que hemos tenido una vida ejemplar en algún aspecto) en vez de “perderla” en tener preferencias sobre el pasado ?. Pongo perderla entre comillas porque es un pasatiempos ingrato cuando das con problemas sin solución (enlaces imposibles de solventar), cosa muy frecuente y aburrido cuando no hay novedades, pero tiene momentos realmente apasionantes.

No hemos entrado, con mi conocido, en temas de fenotipo / salud, pero muy posiblemente tomados con la correcta perspectiva, seguro que también tienen que ser muy divertidos. Pero a mi estos temas, los de salud, son los que más miedo me dan con respecto a la privacidad.

2. La gran desventaja es que te ríes sólo si compartes los datos, y sólo puedes compartir con personas de gran confianza. En mi familia (cercana) los temas genealogicos no interesan apasionan a casi nadie (en una de las lineas somos tres los apasionados, cada uno me imagino por sus propios motivos; y en las otras solo uno: yo  mismo; para mi es un tema familiar y nunca hablo de ello en privado con nadie más que mi familia; por lo ya dicho, hablamos poco de esto; el tema me interesó en su momento y luego me aburrió dado que no encontrábamos nada nuevo), y por lo tanto este es otro de los motivos para no hacerse el test. En este tema, la diferencia entre interés y pasión es igual a la diferencia entre ir a los archivos y/o hacerse el test y sólo escuchar con un cierto interés los resultados. Hay mucha gente a los que incluso no les interesa ni escuchar los resultados y su posición quizás sea la más razonable: si no me equivoco, en lo genético somático neutro, el peso de los antepasados más recientes es abrumador y sobre ellos en general se sabe todo ya que los has conocido personalmente. ¿ Que quede un 0,00001% de dna somático neutro de una persona de hace 100.000 generaciones con el que te interese tener conexiones ? Pues bueno….Esto nos lleva además a los problemas de identificación / privacidad sobre los que hacemos comentarios más detallados en un punto posterior.

dna-shared-between-relatives

[Nota al margen: En la tabla anterior el porcentaje teórico del genoma que se comparte con otros parientes en función de la generación y grado de parentesco. Self es el ego, o sea uno mismo. Como ya explicábamos en la entrada anterior, el número de antecesores directos crece en teoría exponencialmente en función del número de generaciones; como en el pasado hubo menos población, menos cuanto más tiempo hacia atrás, está claro que a partir de un cierto momento, varias líneas ancestrales directas llevan a un mismo ancestro hasta concentrarse todas en uno  solo. Esto es fácil expresarlo de manera simplificada, pero complicado de analizar desde el punto de vista matemático, como hace este autor en un artículo, Profesor de Estadística, en el que concluye que el Mas Reciente Ancestro Común de la población global actual vivió hace  1000 años. Este resultado se vio confirmado desde el “punto de vista empírico” el año pasado en un artículo al que ya hemos enlazado en la anterior entrada.

Por otra parte los linajes patrilineales han tenido (a posteriori claro, nadie sabía el modo de transmisión de este cromosoma cuando emergieron los linajes, una cierta justificación genética: el cromosoma Y. Desconozco si en antropología social existen también matrilinajes, en las que los derechos se transmiten de madre a hija que podrían estar justificadas a posteriori en el ADN mitocondrial. Fin de nota al margen]

3. 23andme es un primer paso  necesario para familiarizarse. La plataforma está realmente muy bien diseñada en lo informático, pero se queda un poco corta en lo biológico: en lo uniparental (creo) que sólo hacen análisis de SNPs que para el horizonte genealógico medio (500 años, unas 20 generaciones) no sirve de mucho.  En lo somático es lo contrario: su análisis solo mira 9 o 10 generaciones hacía atrás (es decir sólo permite encontrar conexiones somáticas con parientes lejanos descendientes de un pariente de linea directa de hace unos 350 años, cosa que a muchos europeos, con genealogías documentadas de unos 500 años de profundidad  (y más escasos con más tiempo) dejará fríos.

4. El siguiente paso en lo uniparental es  posiblemente Family Tree DNA (FTDNA). Para el cromosoma Y tienen análisis STR que creo es menos fiable que el de SNPs (tengo que estudiar este tema) pero es lo que hay. Ahora mismo el análisis más potente que tienen es el FTYDNA-111 a unos 280 euros. Le comentaba a mi conocido que aunque hay una cierta presión en el mercado con un Full Genome Y a unos 900 euros, es posible que ambos FTYDNA-111 y Full Y Chromosome puedan ser ahora mismo excesivos: tener este nivel de resolución es interesante ahora si y solo si la mayoría de la gente lo tiene. Como son caros y la mayoría de la gente tiene tests más baratos de menos resolución, hacérse estos tests tan potentes quizás sea anticiparse. ¿ Anticiparse cuanto ?  Como este mercado se está acelerando: entre pocos años y varios meses.

5. Hay varios interrogantes que me han surgido sobre la identificación de los usuarios y de sus lapos, tema relacionado con la privacidad. Son preguntas que me han ido surgiendo con la experiencia de mi conocido y me pongo en la posición de un consumidor genérico, pero paranoide. ¿ Como sabe este consumidor medio que otro usuario de la plataforma, uno que dice tener su mismo apellido, de verdad tiene este apellido y ha utilizado su verdadero  lapo para hacerse el análisis y no el primero que haya visto por la calle ?. Y aunque se den estas condiciones ¿ Como sabe el usuario de 23andme, por poner un ejemplo, que los resultados se corresponden con su lapo ? Puede haber falsos negativos de parentesco personal, que por esto, en realidad, sean positivos y viceversa. A mi así de pronto, solo  se me ocurre una manera: centro físico de recepción con presentación DNI, lapo in situ y análisis presencial transparente, no valdría, literalmente, una caja negra. Tras el test en estas condiciones emisión final de certificado. Esto parece la cota superior del protocolo seguro de identificación de DNA y de la persona portadora: matar moscas a cañonazos, muy caro. Otra solución para los desconfiados (muy cara también aparentemente) es la repetición de tests. A todo esto hay que darle una verdadera vuelta, que seguramente ya le habrán dado algunos estudiosos.

6. Organización industrial del sector y perspectivas. Este es un sector (me refiero al de la Genealogía Genética) dónde están convergiendo las TIC con las Biotecnologías. Hasta el año 2000 la técnicas de test genéticos no habían salido prácticamente del laboratorio científico. No eran ni mucho menos un producto de gran consumo. Los principales hitos del sector son:

Gene Tree, fundada en 1997 y que inicialmente ofrecía sobre todo tests de paternidad, se vendió a la fundación Sorenson Molecular Genealogy Foundation (dispone de una base de datos de 100.000 tomas individuales de dna), que a su vez ha sido adquirida en 2012 por Ancestry.com Esta última es una empresa de genealogía histórica o documental tradicional muy consolidada (the company had more than 2,000,000 paying subscribers as of June 2012 and expects 2012 revenue of $473.0 to $480.0 million. Ancestry.com also made several recent acquisitions of its own including iArchives.com in August 2010 and 1000memories in October 2012. Fuente forbes) que ha visto que se quedaba fuera de juego si no entraba en el sector de la genealogía genética. En 2012 la adquirió a su vez (me refiero a ancestry.com  un fondo europeo, Permira por 1,6 billones de usd: Permira shares our vision that family history remains a large and still untapped market, and they are excited about helping us with our strategy to invest in new technologies and products. They will help us to bring even more content online for our subscribers, building a great global brand, and expanding into new international markets. El objetivo es extender el modelo de negocio a Europa dónde que yo sepa, aunque múltiples hay plataformas colaborativas (como por ejemplo Geneanet) no hay jugadores empresariales de peso. En España, además de existir también plataformas colaborativas, muchas bases de datos históricas están en manos públicas y accesibles a través de plataformas en mi opinión muy bien diseñadas: citamos por ejemplo la web del INE sobre apellidos, el Portal de Archivos Españoles PARES, dependiente del Ministerio de Educación y Cultura  o la web de la Hemeroteca de la Biblioteca Nacional. Lamentablemente hay un cierto fraccionamiento por la organización territorial (muchos archivos dependen de Ayuntamientos, Comunidades y Estado Central), la cosa va lenta (todavía hay mucho documento no digitalizado) y, finalmente, los documentos que están digitalizados y accesibles sólo los entenderán los expertos en paleografía hispánica (una transcripción en castellano actual sería muy deseable, pero imagino que cara). 

¿Tiene sentido integrar genealogía genética y genealogía histórica en una misma empresa ? No lo sé. Desde el punto de vista del consumidor son dos culturas muy diferentes. Sigo algunos blogs de biogeografía humana y el comentarista medio de este tipo de blogs, además de no aplicar muy correctamente la lógica genética, desconoce completamente la historia de las zonas de las que habla: se lee en diagonal la primera entrada de wikipedia que encuentra, y luego pontifica en su comentario. Y no se si el aficionado a la genealogía histórica europeo, estará muy abierto a usar la genealogía genética.  La lógica de la genética no es muy complicada de comprender pero hay que dedicarle un cierto tiempo y usar un tipo de razonamiento matemático y no sé si el aficionado medio a la historia, más asociada a las humanidades, estará por la labor. Técnicamente me parece que el chip de Ancestry.com solo ofrece tests somáticos. Extracto de su FAQ:

How does the new AncestryDNA test differ from other Ancestry.com DNA tests?

It’s more comprehensive. Unlike the Y-chromosome or mitochondrial DNA test, AncestryDNA uses an autosomal DNA test that surveys a person’s entire genome at over 700,000 locations. It covers both the maternal and paternal sides of the family tree, so it covers all lineages. The Y-DNA test only reflects the direct father-to-son path in your family tree, and the mtDNA test only reflects the direct mother-to-child path in your family tree. Learn more about the differences between the DNA tests here.

The test is gender neutral. Both men and women can take the AncestryDNA test and are tested in the same way for the same number of markers providing the same level of detail in the results.

It predicts your recent genetic ethnicity. Thanks to advances in DNA technology we’re able to compare your DNA to samples from around the world, to find out more about your family’s background and ethnic history—not ancient history, but the people and places that matter to you.

Enhanced DNA matching. Unlike the Y-chromosome or mitochondrial DNA tests, the new AncestryDNA autosomal test looks at a much broader range of your DNA, which helps identify matches throughout your entire family tree—along both your paternal and maternal sides.

The information is more relevant and recent—targeting your family history a few hundred or even a thousand years ago, as compared to the Y and mtDNA tests, which have a 10,000 to 50,000 year time focus.

Improved website. AncestryDNA has a significantly enhanced personalized site experience with interactive tools and features to make your family history search even easier.

Family Tree DNA es la primera empresa del sector que le dió el giro necesario para convertir una herramienta científica o detectivesca, el test genético, en un producto comercial, el kit de análisis genético y todos los servicios asociados (a través de la plataforma web). Se fundó en el año 2000 y hoy está bajo el paraguas de Gene by Gene, de la que constituye una de las cuatro divisiones operativas de negocio.  Es la compañía de genealogía genética que ofrece un test genético más completo basado en muestra (STRs). Para el cromosoma Y recientemente han lanzado el BigY. Han acumulado una base de datos con unas 500.000 tomas individuales de DNA y colaboran en el Genographic Project de la National Geographic Society. En este contexto en 2012 se lanzó el Genochip.

23andme es un jugador relativamente reciente. Se fundó en 2007 y ha acabado en la órbita de Google que actúa, entre otros, como capitalista de riesgo. Esta compañía, que factura unos 20 millones de usd, tiene un modelo de negocio similar a FTDNA: chip muestral (no lo fabrican ellos), kit, raw y plataforma web de servicios de análisis de datos (identificación de haplogrupo, BGA) y búsqueda de parientes. Es la plataforma que mejor conozco ya que la he usado (con la cuenta de mis conocido) y ya la hemos presentado extensivamente en la anterior entrada. Sólo decir que 23andme ha lanzado recientemente su nuevo chip (que es básicamente el iSelect de Illumina) con menos SNPs que el anterior. Su objetivo con este nuevo chip no es mayor profundidad en los datos sino mayor velocidad (y rentabilidad, imagino) en el proceso: con este nuevo chip pueden analizar en paralelo el ADN de 24 clientes en vez de  8,  como en el anterior. Y doy fe que son rápidos: en pocos días ya tienes el raw a tu dispsición.

Fullgenomes Corp. Es el último jugador en entrar. Ofrecen servicios de cromosoma Y completo a unos 900 euros, asequible pero todavía caro para consumo masivo incluso dentro del nicho de apasionados. Además de caros este tipo de secuencia completa lleva su tiempo (varios meses). Aparentemente se han centrado en la parte de logísticakit. Ni hacen big data analysis ni tienen también plataforma web de intercambio.  Su output es exactamente esto. Para más análisis el que se haya realizado un full cromosome deberá ir a webs especializadas: Yfull, Anthrogenica o solicitar los servicios de algún consultor de genealogía genética. Eso si, la empresa ha nacido con una vocación internacional (por ejemplo, te desvían automáticamente a una página en Español, cosa que no hacen ninguna de las anteriores). Los ADN de Fullgenomes Corp se analizan en el BGI.

BGI (Beijing Genomes Institute). BGI es un instituto de investigación chino independiente con una estructura de financiación compleja (The Institute has described itself as partly private and partly public, receiving funds both from private investors and the Chinese government. The laboratory was also the Bioinformatics Center of the Chinese Academy of Sciences) pero bastante dinámica en el sector desde su fundación en 1999.

Illumina. Hablando de secuencias completas, el lider absoluto del fabricantes de chips/máquinas secuenciadoras es Illumina (70% de cuota). También es de creación relativamente reciente (1998) y ha obtenido esta posición dominante gracias a la compra de Solexa.  Con esta y otras compras ha ido dejando atrás a otros competidores como Roche-454LifeSciences (que ha abandonado el sector de la secuenciación) o Complete Genomics finalmente comprada por BGI. Illumina ha anunciado recientemente su HiSeq Xten un secuenciador de genoma completo  que permitiría una secuencia por 1000 usd (entiendo que de coste, no de precio consumidor que como hemos visto en la anterior entrada está todavía a unos 3500 euros, servicio todavía caro en mi opinión para consumo masivo). Illumina factura unos 350 millones de usd al año y recientemente fue objeto de una OPA hóstil por unos 5 Billones de usd. Illumina está concentrada en las fases de chip y Big Data Analysis. No he visto que tengan plataforma de intercambio, al menos para genealogía genética. Al ser este un análisis empresarial, no vamos a hablar del Proyecto 1000 Genomes. Me pregunto, sin respuesta, cuantos genomas completos habrá secuenciados al fecha de hoy…

Como se ve ya existe una organización industrial bastante desarrollada en el sector, sobre todo en USA. En torno a esto 4 o 5 grandes jugadores y sus proveedores (Illumina, BGI) están surgiendo nichos para pequeños jugadores, como los consultores de genealogía genética. En España he visto que hay bastantes laboratorios que ofrecen algunos de estos servicios, muy centrados de momento en los tests de paternidad.

Resumiendo, la organización industrial del sector está dividida en cuatro partes claramente diferenciadas: Chip + Kit + Big Data Analysis + Plataforma web de intercambio de información genética (por ejemplo DNA relatives en 23andme). Por Kit me refiero a la parte logística de recogida de muestras a distancia y es la parte que estaría más relacionada con el problema de la autentificación / identificación. Por Big Data Analysis me refiero por ejemplo a cosas como el BGA (asignación biogeográfica), el tipo de servicios que ahora mismo provee gratis por ejemplo GEDMATCH (como el BGA Eurogenes V2 K15 sobre el que hemos hablado en detalle en la entrada anterior).

Está por ver si este negocio llegará a ser masivo (si todos nos haremos un test genético para salud y/o genealogía) o se quedará  en un negocio de nicho. Creo que dependerá de que se resuelvan los problemas de privacidad. En mi modesta (y seguramente desinformada) opinión chips-kits DIY para full genome (es decir, un chip que compres, escupas sobre el, lo metas en el puerto USB y te dé la secuencia)  serán (o deberían de ser, en el futuro) una commodity a precio regalado. Una vez tienes el raw en tu ordenador, probablemente también se preferirá extraer conocimiento a partir de estos datos brutos, con software que te puedas descargar y ejecutar en casa y usar la plataforma de intercambio de información genética, para salud o genealogía, intercambiando los bits o bases de información que quieras.

Sí en singular: la parte del negocio de la plataforma de intercambio es un negocio de red y por lo tanto seguramente al final habrá sólo una global. Por todo ello seguramente veremos más M&A en el sector en breve. Aunque cada una de las empresas tiene su particularidad, cuatro o cinco ya son muchos jugadores, sobre todo si hablamos de plataforma de intercambio.

[Nota al margen: Ojo, el hacerlo en casa te evita los problemas de privacidad, pero no los de identificación y este deberá de ser resuelto. Si no, ya estoy viendo el  mercado negro de lapos ilustres:

¡ Confucios a 300 euros…8 centimorgans de conexión mínima garantizada ! ¡ Carlomagnos cromosoma Y a 100 euros oígaaa….+ 1 euro la somática ! ¡ El Cid regalado incluidos todos los Reyes de Navarra ! ¡ Descendientes de Matusalén: a 0,1 el año   ! ¡ Enlazamos con tres premios Nobel y un Óscar !

Esto puede sonar a coña y lo es, pero pasó con las genealogías, con los apellidos y puede volver a pasar perfectamente con el ADN. La picaresca puede progresar tanto como la tecnología. Obviamente éste método de falsificación de adn-identidad no es de escala. Un mismo lapo de un mismo individuo no se puede utilizar demasiadas veces y solo una si hubiese una plataforma única de intercambio de información. Tampoco creo que vayan a ser fáciles las falsificaciones por otros medios. El DNA tiene su lógica y para hacer una buena falsificación hay que conocerla y seguirla. Fin de nota al margen].

Terms and conditions: 1. Any commenter of this blog agrees to transfer the copy right of his comments to the blogger. 2. RSS readers and / or aggregators that captures the content of this blog (posts or comments) are forbidden. These actions will be subject to the DMCA notice-and-takedown rules and will be legally pursued by the proprietor of the blog.

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s


A %d blogueros les gusta esto: