NiNCh ([info]ninch) wrote,
@ 2009-01-27 18:22:00
Previous Entry  Add to memories!  Tell a Friend  Next Entry
Current mood: sleepy
Current music:A Perfect Circle - "Constantly consuming..."

It's alive! (c) Robot chicken
У меня тут в лаборатории нечто вроде события, я наконец доклепал до рабочего состояния проект, который обещался сделать к ноябрю, а до этого к августу. Ну, были всякие форс-мажоры и асапы, you know. Так вот.
Под катом находится собсна творение, ну и для не больно посвящённых краткое объяснение, что это за штука.


Как уже стало очевидно, это не что иное, как неведомая ёбаная хуйня анимированный PCA с таки непойми чем. Да, мне было влом выпиливать подписи в и без того огромном коде, только на запуск которого я убил чистые сутки.
Сразу скажу, научная ценность сего действа (впрочем, как и любых других моих поползновений) откровенно невысока; если взять для аналогии вместо науки рунет, то это будет Упячка — толку мало, зато очень весело. Вообще, PCA можно применять много для чего, но вот конкретно я беру данные по SNP на выборке в пару сотен человек, и леплю приблизительно такие унылые графики (выборка людей ровно та же, можно сопоставить цвета):

Алгоритм распределяет людей по карте в зависимости от схожести их генотипов. Поскольку большинство народов мира расселялось не на дилижансах и самолётах-пароходах, а очень даже пешком и понемножку, то и географическое распределение народов уже на умозрительном уровне должно коррелировать с распределением генетическим. Последние несколько лет модно было такие штуки показывать на Европе. У нас ровно то же самое, только по Сибири; за исключением русских (в данном случае, гопники из Новосибирска и староверы из деревни образца XVI века, тоже где-то в ебенях), которые понаехали тут и место им под Владимиром, остальные же неплохо вписываются административную карту.
А причем тут анимация? Суть в том, что здесь использовался снимок не всего генома разом (в рамках доступности технологий, конечно), а серия снимков перекрывающих друг друга кусков хромосомы от начала к концу (первой и возможно ещё задело вторую, а может и нет, не проверял). Теоретически и если очень повезёт, то можно будет обнаружить такой кадр (=участок хромосомы), в котором какие-нибудь казахи уедут в дислокацию Китая, например из-за пагубного влияния Семипалатинска. Но лучше просто наблюдать, как колбасит вторую главную компоненту сверху вниз.




(13 comments) - (Post a new comment)


[info]mihun
2009-01-27 07:10 pm UTC (link)
Ну и кто будет финансировать такую непонятную научную упячку?
Может пойдешь к нам ночным админом? =)

(Reply to this) (Thread)


[info]ninch
2009-01-27 07:13 pm UTC (link)
Как раз упячку быстрее профинансируют, как показывает практика.
А я не помру, в ночь работать? Скорее нет, меня на днях уже обещают устроить в курчатовский, может там допусловия будут.

(Reply to this) (Parent)


[info]mihun
2009-01-27 07:12 pm UTC (link)
Не, в нельзя это на красивую карту положить? Взять цвета поярче? Засунуть во флеш, сделать пару сладеров - скорость и ищо ченить. В гугланалитиксе ролики видел? Вот там примерно такая же фигня, тоже непонятная, но зато прикольно выглядит.

(Reply to this) (Thread)


[info]ninch
2009-01-27 07:18 pm UTC (link)
Цвета автоматически выбираются, проходом по кругу в HSL. А сатуры и света я как-то недоложил, вижу.
Флеш это хорошо, но три языка в одной ступе месить - ещё хуже, чем два сейчас. Там как бы и мегабайты текста парсить, и статпакету передавать, и обратно забирать.

(Reply to this) (Parent)


[info]_aksinia_69
2009-01-28 03:34 pm UTC (link)
поздравляю
потом как-нибудь расскажешь подробно

(Reply to this)


[info]hirou
2009-01-28 05:13 pm UTC (link)
у меня подозрение, что здесь кортинка, которую я не вижу... и чувствую себя, как лох...

(Reply to this) (Thread)


[info]ninch
2009-01-28 06:30 pm UTC (link)
Картинки две, обе на одном хостинге, обе у меня показываются наново. Может, проблема в том, что анимация в 3 мегабайта и 100 фреймов?

(Reply to this) (Parent)(Thread)


[info]hirou
2009-01-28 06:44 pm UTC (link)
мозилла так и не подцепила, а вот експлорер (тьфу-тьфу-тьфу) показал... действительно, неведомая .....

(Reply to this) (Parent)


[info]sanchezz_fbb
2009-01-28 11:29 pm UTC (link)
а чего ее так прет-то?))
нечеткость разделения групп - это из-за диамятра точек или из-за малости выборки?

(Reply to this) (Thread)


[info]ninch
2009-01-29 03:50 pm UTC (link)
Диаметр точек, хыхы, это надо было так сказать =)
Они такие широкие, потому что я предполагал представить популяцию как облако, а не россыпь точек. Не так четко, но наглядно. Плюс таки есть несколько не очень хороших сэмплов и есть всякие там буряты с именем Иван Владимирович.

А трясет - по-моему ей в отдельных кадрах энергетически выгоднее вверх ногами торчать, только и всего.

(Reply to this) (Parent)


[info]sorris0
2009-01-29 01:05 am UTC (link)
a chem on lychshe, chem trehmernii pca? ya smotru microarrei na trehmernom vsegda.

(Reply to this) (Thread)


[info]ninch
2009-01-29 03:20 pm UTC (link)
Кто лучше, анимация или двумерный? Анимация не лучше =)
Двумерный в нашем случае (да и других популяционных) лучше остальных практически всегда - потому что нагрузки на компоненты убывают экспоненциально, и третья несет уже слишком мало информации. Только один раз видел случай, когда действительно требовалась третья компонента; тут бы она пригодилась для разделения староверов и новосибирска, но их даже она не разлучает.
Плюс трехмерный на бумаге не покажешь, без прокручивания он не смотрится совершенно.

(Reply to this) (Parent)


[info]ps1kodel1k
2009-11-15 01:20 am UTC (link)
Хеппи бездей и все такое!

(Reply to this)


(13 comments) - (Post a new comment)

Create an Account
Forgot your login or password?
Login w/ OpenID
English • Español • Deutsch • Русский…