Metablogging. Hito alcanzado.

julio 27, 2015

La semana pasada, el 22 o el 23 de julio, superamos la barrera de

Leer el resto de esta entrada »

Imperialismo computacional. Recopilación de enlaces julio 2015,1.

julio 27, 2015

1. Roboteología.

¿ Tienen alma los robots ?

Leer el resto de esta entrada »

HPC. El Top10 del Top500.

julio 23, 2015

Como viene siendo habitual, en ISC15, que tuvo lugar la pasada semana (he considerado seriamente ir éste año, incluso tenía ya presupuesto preparado pero finalmente, por motivos que no voy a explicar he declinado asistir)  se ha presentado la primera edición del ranking para 2015. Como viene siendo habitual, nos hacemos eco de la noticia, con un poco de retraso

Una imagen con el Top10 a continuación.

top500-2

Me parece una lista bastante multicultural. Me sorprende gratamente (la única sorpresa) ver bien posicionado a un país de la región de Oriente Medio en éste tema.

Extracto (Inside HPC).

The only new entry in the Top 10 supercomputers on the latest list is at No. 7—Shaheen II is a Cray XC40 system installed at King Abdullah University of Science and Technology (KAUST) in Saudi Arabia. Shaheen II achieved 5.536 petaflop/s on the Linpack benchmark, making it the highest-ranked Middle East system in the 22-year history of the list and the first to crack the Top 10.

The other nine systems in the top 10 were all installed in 2011 or 2012, and this low level of turnover among the top supercomputers reflects a slowing trend that began in 2008.

¿ 2008 ?. Éste año me suena…Y en realidad no debería de haber espacio para la sorpresa en ésto: la industria petrolera es una gran usuaria de supercomputación y es lo normal que haya un sistema potente en la región del globo con más rservas. La sorpresa es que no apareciese antes algún país de ésta región.

mark-map2

En otra fuente redundan sobre la falta de sorpresas: However, one of the biggest trends of note is that the list overall, across countries and systems types, is in a rut with unprecedented low replacement rates and old systems that are still running the benchmark and keeping the list essentially where it was in late 2013-early 2014….As the Top 500 founders noted today at ISC ’15, “the age of the population in the top 10 is unprecedented” and the replacement rate for machines at both the top and bottom of the list is also slower than any point since the list was introduced in 1993.

Multicultural en la localización geográfica de los sistemas y en su propiedad. Ésta industria / tecnología sigue estando dominada por EEUU en componentes y en sistemas completos: 4 son de IBM, 3 de Cray y uno de DELL.

Extracto (misma fuente). 

  • HP has the lead in the total number of systems with 177 (35.4 percent) compared to IBM with 108 systems (21.6 percent). Last November, HP had 179 systems and IBM had 153 systems. In the system category, Cray remains third with 71 systems (14.2 percent).

En total, al menos 356 sistemas fabricados por empresas de EEUU. Y seguramente habrá más de esta nacionalidad. No debe de sorprender no ver a IBM en los primeros puestos.  Ya dijeron en su momento que abandonaban la carrera por el liderazgo en el TOP500. Es más aparentemente están desinvirtiendo en sistemas.

Nota. He visto en el periódico que IBM ha sufrido una espectacular caída en bolsa hoy, por unos resultados peores de lo esperados. ¿ Será sólo por los resultados ? Lo digo porque por lo visto están cambiando su modelo de negocio, cambio que tiene que ver con la desinversión en sistemas. Es posible que hagamos  una entrada en breve sobre ello. También he visto que hace poco ha habido un movimiento contrario, es decir de subida,  con respecto a Google. Casualmente unos días después de que nosotros  hiciésemos una entrada sobre ello. Si finalmente hacemos la entrada, también hablaremos sobre éste movimiento de Google.

Tras leer informaciones públicas ya tengo más o menos claro lo que está pasando y diría que todo puede ir más rápido de lo esperado o no suceder nunca: es un tema que sale de manera recurrente. Fin de nota.

Por otra parte, aunque su peso relativo está declinando, EEUU sigue siendo el país con más sistemas (230). Japón (pasa de 18 sistemas en 2010 a 39 en 2015), como China (que está cambiando calidad, como el sistema Tianhe-2, por cantidad: ha bajado de 61 a 37 sistemas en el Top500 desde 2014), han realizado un esfuerzo en los últimos y están también bien posicionados. Y no nos olvidemos de Europa que como agregado suma un total de 141 sistemas.

No hay muchas novedades tampoco sobre las interconnectAnother growth curve to watch is around InfiniBand technology, which is now found on 227 systems, up from 225 on the last list in November. On the flip side, gigabit Ethernet has dropped from 187 to 147 systems due to 84 new systems that are using 10GbE interfaces.

Enlaces de interés:

Un artículo en profundidad en The Platform sobre ésta edición del Top500.

De este artículo extraemos dos interesantes imágenes sobre los procesadores y aceleradores utilizados en los sistemas. Intel predomina en procesadores: 86% de los sistemas.

top-500-chip

Sólo 88 de los 500 sistemas utilizan aceleradores (pensaba que serían más) y en éste mercado predomina Nvidia, aunque Intel está ganando terreno con su coprocesador Xeon Phi.

top-500-accelerators

De cualquier manera se observa que éste es un mercado muy dinámico, con tendencias que pueden cambiar en pocos años. Un error en una decisión combinada con un acierto de tu competidor y te quedas fuera rápidamente…Véase por ejemplo cómo Cell, que llegó a ser predominante en aceleradores ha ido perdiendo posiciones hasta casi desaparecer.

Trade Lane Megacities. Riosmundi, cuencamundi.

julio 22, 2015

1. Estamos acostumbrados a una partición del globo basada en fronteras políticas, siempre artificiales, aunque a veces tengan unos condicionantes naturales.

Pero hay otras particiones interesantes, como una partición en cuencas fluviales. A diferencia de los mapas políticos, que abundan, no he encontrado un buen mapa, de gran tamaño y completo con una partición en cuencas fluviales.

En ésta entrada muestro los mejores cuencamundis que he encontrado, añadiendo a veces algunos breves comentarios. Avanzo un dato que ya conocía, pero no deja de sorprenderme: la cuenca más poblada de la tierra tiene casi 500 millones de habitantes (y no es de las de mayor tamaño: un millón de km^2, dos Españas en superficie). ¿ Puede el lector adivinar dónde se localiza ?

Tras la recopilación un par de breves puntos, el primero sobre el agua como recurso escaso y el segundo sobre las consecuencias geopolíticas de la partición del globo en cuencas.

Al redactar ésta entrada e inspirado por mis últimos acontecimientos vitales sólo una cosa me ha quedado clara: somos agua, y como tal seguimos en nuestra acción humana un camino de mínima energía; por mucha fuerza que se aplique a discurrir contracorriente, sea en forma de desbordante torrente congelado, última gota de océano evaporado, lágrima desnortada o flujo exhortado, nos encontraremos todos en la misma desembocadura, modulo cuenca, lado a lado. No hay presa que pueda evitarlo.

86810_big

images

rio_caudaloso-1152x864

arroyo-de-montana,-torrente,-piedras,-agua-126543

rio_baker

paisaje_de_un_rio_caudaloso-1920x1200

300px-Santa_Elena_Canyon

mac-os-x-mountain-lion-wallpapers

Nile-evening-Aswan-Egypt-006

article-0-14E285F6000005DC-205_964x598

20_142750540-1680x1050

big_thumb_41c7f41b7cc75b7bff70050853a85f10

thamesST_470x313

AmaBlueDanube_MainPic

watermap2No siempre zona blanca implica ausencia de río. Turquía por ejemplo no es desértica. El siguiente es más completo pero más confuso.

Leer el resto de esta entrada »

Trade Lane Megacities. Recopilación de enlaces julio 2015, 3.

julio 21, 2015

1. Una (otra) superciudad de 130 millones de habitantes, en la R.P.China.

Leer el resto de esta entrada »

IP. La USPTO toma partido a favor del comunismo en innovación y pone a EEUU a la altura de Venezuela (en comunismo).

julio 20, 2015

Disclaimer: en el título y en el contenido utilizamos la palabra comunismo en sentido meramente técnico, descriptivo.

Leer el resto de esta entrada »

Desarrollo. Recopilación de enlaces julio 2015, 2.

julio 19, 2015

Como siempre 10 puntos de temas relacionados con el desarrollo económico, la historia, biología y neurociencias.

1. La revolución neolítica vista por los economistas. 

Leer el resto de esta entrada »

Trade Lane Megacities. Recopilación de enlaces julio 2015, 2.

julio 13, 2015

1. Ancient ports.

Este sitio web sobre los puertos de la Antigüedad merece un estudio en profundidad.

Extracto.

This web site presents work done to collect, identify and locate ancient harbours and ports. It is based on a study of existing documentation. The result is a list of around3400 ancient ports based on the writings of 66 ancient authors and a few modern authors, incl. the Barrington Atlas. A few “potential ancient harbours” from a nautical point of view, have been added, based on nautical guides/pilots used by modern sailors.

If you are looking for the location of a specific port, use the search engine (top right of this page) that will lead you to the page where this port is mentioned. If you are uncertain about the spelling, you may enter just the part of the name you are certain of into the search engine.

2. La navegación del Mediterráneo (la ruta Egipto-Creta) en el Bronce.

Nos hemos preguntado por la posibilidad de ésta Ruta en otras entradas y habíamos concluido que no era posible en el Bronce, ni siquiera en el Hierro. En ésta tesis argumentan lo contrario, lo cual nos sorprende.

Leer el resto de esta entrada »

Metablogging. Siguen los problemas con el buscador de Google.

julio 11, 2015

Siguen los habituales y hay uno nuevo, que, al parecer, no tiene nada que ver con Argentina, pero combina todos los temas de connotaciones negativas con los  que desde hace un año Google viene asociando mi nombre: seudociencias, drogas, enfermedades mentales, perversiones sexuales y pornografía, satanismo (hay gente que se toma muy en serio ésto), etc…

El nuevo contenido con el que se me asocia es el siguiente:

Blog: La propaganda Oculta.  Informacion sobre propaganda, marketing, control mental, mk ultra y todo lo que necesitas saber.

Obviamente como en todas las anteriores ocasiones, no tengo nada que ver con ésto.

Actualización día siguiente.

Enlace desaparecido. Persisten los habituales

A las 23:00. Ya se sabe que los problemas van y vienen: a ésta hora persisten todos los señalados.

Fin actualización.

El Lapo Azul. Combinando información sobre mutaciones SNP y STR para obtener conclusiones.

julio 9, 2015

Disclaimer. Aunque tengo un cierto interés en las metodologías asociadas a la genealogía genética no soy experto en éstos temas. Escribo ésta entrada más que nada para aprender.

Desde hace tiempo me pregunto como se puede combinar la información disponible en, por ejemplo, los grupos de FTDNA, sobre haplogrupos (basados en mutaciones SNP) y haplotipos (basados en mutaciones STR) para llegar a conclusiones más o  menos ciertas.

1. Algunos casos teóricos / experimentales curiosos.

Extracto.

As each individual has just one evolutionary path on their patrilineal line, so their SNP-based haplogroup should correlate with their STR-based haplotype, and it does.

Fuente.

Según y como al anterior extracto. Una primera precaución que hay que tomar es que dos individuos pertenecientes a diferentes haplogrupos SNP (por ejemplo H y J), pueden tener el mismo haplotipo STR. En el artículo enlazado hablan de que ésto es posible para 17 marcadores STR y entiendo que se puede ampliar (aunque la frecuencia será menor) a un mayor número de marcadores. Por lo tanto el lector queda advertido: si solo tienes un test STR de pocos marcadores y tienes matches perfectos con otros individuos, ésto no significa necesariamente parentesco: puede ser debido a convergencia aleatoria.

Pero me interesa más el problema inverso: los diferentes clusters de haplotipos STR que aparecen asociados a un mismo subhaplogrupo. ¿ Cómo se puede interpretar éste fenómeno ? Supongamos que un individuo está asignado a un haplogrupo, digamos Z1, en el cual existen diferentes clusters y que de acuerdo a comparaciones STR (de 67 marcadores por ejemplo) se encuentra a una distancia media, digamos de 10 mutaciones de los individuos de un cluster (ésta media se puede obtener calculando la distancia genética de éste individuo con respecto a todos los individuos del cluster y obteniendo la  media arítmetica de las  medias obtenidas) y, de nuevo de media, a otra distancia de 20 mutaciones de los individuos de otro cluster. ¿ Como se pueden interpretar estos datos ?. Yo los interpreto como sigue. En un punto del tiempo se separa un cluster (el de 20 mutaciones) pero el individuo considerado y los individuos del clsuter a distancia 10 siguen constituyendo una misma linea. En un punto posterior del tiempo el ancestro del individuo considerado se ramifica con respecto al ancestro del cluster de distancia 10.

Nota. Este ejemplo es ficticio, pero se aproxima a uno real. Fin de nota.

Extracto.

At this writing (2012), the number of SNPs found has greatly increased, and the rate of their discovery is increasing due, in part, to FTDNA’s “Walk through the Y” program.  We are reaching the point where they are of use to the genealogist, especially in the common haplogroups, as the Y-DNA haplotree turns into a finely divided bush.  For that reason, I now urge that Y-DNA project members,  especially those who are Haplogroup R1b1a2 or I1 — the two most common haplogroups in western Europe — be deep SNP tested and that they continue to test new SNPs as they are discovered.

As the number of people STR tested increases, SNP testing will become important in separating “borderline” STR matches that are merely coincidental, that is, not indicative of real relationship, from ones that do indicate real relationship.  The problem of ambiguous coincidental matches, particularly in Haplogroup R1b1a2, is going to increase as more people are tested.  Thankfully, deep SNP testing gives us a method for detecting them.

The bottom line is that, while SNP testing is not a requirement for participation is a Y-DNA STR surname project, I encourage it because, while I once thought deep SNP testing was merely “interesting,” it has now become actually useful to the genealogist.

Fuente.

Hasta aquí, creo, casi todo evidente. Pero que pasa si ahora tenemos otro haplogrupo, situado a una mutación SNP del anterior, en un nivel del árbol anterior, digamos Z0, y entre los clusters de éste segundo haplogrupo hay uno con el que nuestro individuo se encuentra a una distancia STR media de 5 y otro de 30. Primer pregunta: ¿ Es esta situación teórica posible en la realidad ?. Segunda pregunta: ¿ Si lo fuese que explicación podría tener ?. Diría que no es imposible. Y algunas explicaciones alternativas pueden ser: convergencia aleatoria STR o mutación SNP hacía atrás o puede ser debido a un efecto de muestreo. Ahora lo interesante sería poder pasar de una valoración de posibilidad a una estimación de probabilidad.

¿ Son probables éste tipo de eventos ?. Entiendo que no, aunque sinceramente no lo sé. El caso es que ya he detectado algunos. Por ejemplo, una distancia STR media de un individuo a un cluster de su mismo subclade bastante mayor que la que le separa con respecto otro cluster de otro subclade del mismo haplogrupo, localizado a una distancia del suyo de uno o dos  SNPs, hacía arriba o hacía abajo en el árbol. En general ver ésto me crea una cierta confusión y de momento no tengo muy claro como explicar éste tipo de eventos (salvo las dos explicaciones que ya hemos apuntado), suponiendo que sean reales y no provisionales. Entiendo la convergencia en el caso de un individuo. ¿ Pero una convergencia de dos clusters situados en diferentes subclades, comparando todos los individuos con todos los individuos ?  

Mis presuposiciones, que utilizo para razonar sobre todo ésto (y como ya digo que no soy experto, puedo estar equivocado)  es que en todo árbol debe de haber una coherencia entre los resultados SNP y los resultados STR.

Como regla general, suponiendo que todas las ramificaciones de un linaje se han ido encontrando en entornos similares, cuanto más arriba en el árbol se encuentra un nodo, entiendo que mayor tiene que ser el número de clusters y mayor la distancia media entre ellos.

Las excepciones a ésta regla entiendo que indican que el entorno en el que se han encontrado algunas líneas ha sido o  más favorable (y entonces tendrán más clusters que otros nodos más antiguos y ¿ separados por una mayor distancia ?) o más desfavorables (y entonces tendrán menos clusters y ¿ separados por una menor distancia ?).

Dejo al lector que averigüe si este tipo de razonamiento sirve para explicar los extraños eventos que hemos reseñado. ¿ Como se explica por ejemplo  que en un nodo situado más abajo en el árbol la distancia media entre los clusters sea superior a la de un nodo situado más arriba ?.

Nota. Por otra parte la construcción de clusters por parte de los responsables de los grupos de FTDNA parece a veces una tanto ad-hoc. Entiendo que debería de haber un corte de distancia genética por encima del cual no se puede formar un cluster. Posiblemente no haya un corte natural, pero si se puede marcar uno convencional. Fin de nota.

2. Dataciones.

Además de obtener estimaciones de probabilidades, nos interesa sobre todo obtener dataciones: la genealogía es una ciencia histórica.

Para dataciones genéticas, y ésto ya lo hemos visto en anteriores entradas, la tasa de mutación es clave. Y depende de la potencia de la muestra. Por ejemplo si utilizamos para estimar la tasa de mutaciones SNP, tests de BigY, que son bastante potentes pero no los más potentes posibles (es decir testan bastantes posiciones del cromosoma Y, pero no todas las posiciones) obtenemos una tasa, por ejemplo de 136 años por mutación SNP.  Pero si utilizamos tests de FGC (Full Genomes Corporation) que testa bastante más posiciones (ojo, pese al nombre no testa todas las posibles, sigue siendo una muestra), obtenemos una tasa de mutación SNP bastante más alta: un SNP cada 80-90 años. Casi el doble que el anterior.  Si hemos construido el árbol en base a Big Y tendremos fechas el doble de largas que si lo construimos en base a FGC. En vez de eventos que ocurrieron en el Bronce, hablamos de eventos de tiempos del Imperio Romano. Y para añadir más complicación, también se pueden hacer dataciones en función de las mutaciones STR obteniendo un tercer tipo de resultados. Como este debate en torno a las dataciones genéticas está lejos de haberse resuelto, no nos queda más remedio que, en base a la información disponibles, construir escenarios para las diferentes épocas.

Apéndice: enlaces relevantes.

Una entrada en un foro a la que ya hemos  enlazado en anteriores entradas. Copiamos el comentario que hicimos en su momento con mínimas ediciones.

En este foro comentan sobre una heurística para calcular la fecha  de separación de dos líneas genéticas conocida la distancia genética STR, y hablan concretamente del número de marcadores que nos interesa, 67.

I’m very surprised at the nearest matches you quote for me. Comparing my 67 STR markers they come very far down my “match” list, eg

177000 is only 52/67 GD 15 and

147230 is 50/67, GD 17

(interestingly both these IDs quote the same “oldest known ancestor”, but they have slightly different STR values). 

Y en contestación a ese comentario.

Nearest to you are

N1796 GD 16, ab 1420 years.

7 Sweden GD 8, about 690 years and

217193 England, 97963 Sotland GD 11, ab 950 yearsThey are on the same branch in the phylogenetic tree (Network 4.6.1.0. MJ).

83582 England, 7356 England GD 15, ab 1330 years.

192609 Russia GD 15, ab 1330 years

N15255 England, N15255 England 

Some Finns GD 18-20.

Se confirma por lo tanto, primero, que no consideran éstas distancias genéticas en Y67 (entre 8 y 20) ruido aleatorio sino que piensan en ellas como significativas y segundo que aplican una heurística similar a la señalada: 1 punto de DG STR entre  86 y 88 años. Cuanta más distancia genética, más años.

Comentario añadido: la heurística de 88 años por mutación STR (suponiendo la máxima gradualidad en las mutaciones) encaja con la medida de 90 años por mutación SNP (que también supone la máxima gradualidad).

Una entrada en un foro de genealogía genética en la que un experto explica su metodología para obtener sus tasas de mutación.

Extractos.

To summarize, before the above estimates are further refined based on investigating more families with known genealogies, or based on some new radiocarbon-dated archaeological remains, I would recommend using the above number of 84 years (or the 81-91 range) for each reliable FGC-tested SNP, and 140-150 years for each relaible BigY-tested SNP. And since I know that people frequently use such estimates to calculate the age of a single lineage, I would like to remind all of you that only by testing multiple independent lineages descending from a common ancestor (and calculating the average number of SNPs) one may get a fairy reliable TMRCA estimate. Also, when calculating the age of a specific clade, it is always good to compare it with the age of some sister clades, as it is always possible that a substantially decreased or increased number of mutations at the root of a given clade (due to some random fluctuations) may significantly affect such TMRCA calculation.

Entonces si en un árbol dado se combinan BigY y FGC, ¿ debemos de aplicar alternativamente un intervalo temporal  u otro ?.

Una entrada en un foro de FTDNA dónde comentan sobre las tasas de mutación en base a BigY y en base a FGC.

Extractos.

FGC tests significantly more yDNA locations than Big Y does. And, not surprisingly, FGC’s test results find more SNPs. So their estimate of the SNP rate is a new SNP about every 90 years or so, roughly one every three generations.

–en éste reciente artículo comparan varios métodos de datación.

Título. Evaluating the Y chromosomal STR dating in deep-rooting pedigrees. 

Abstract.

Background

Y chromosomal short tandem repeat (STR) has been used in time estimations for single nucleotide polymorphism (SNP) lineages or eminent persons. But to choose which mutation rate and estimation method in the Y chromosome dating is controversial, since different rates and methods can result in several-fold deviation.

Findings

We used two deep-rooting pedigrees with full records and reliable dates to directly evaluate the Y chromosomal STR mutation rates and dating methods. We found that the Y chromosomal genealogical mutation rates (OMRB and lmMR) in BATWING method can give the best-fit estimation for historical lineage dating.

Conclusions

This study validated a very efficient and reliable way for genealogy and historical anthropology researches.

 


Seguir

Recibe cada nueva publicación en tu buzón de correo electrónico.