Pokaż wiadomości
Strony: 1 [2] 3
16  Koło Naukowe / Portal z zadaniami / Odp: Optymalizacja rozwiązania a. k. a. Projektowanie leków trochę inaczej : Marca 09, 2015, 04:23:29
Cytuj
Troszkę brakuje mi wprost powiedzianego, co właściwie oznaczają te liczby - w sensie dobrze rozumiem i bez tego o co chodzi w zadaniu i czego się ode mnie chce, ale co to właściwie znaczy, że substancja o ID 1 ma wartość 0.15? Nie chodzi mi o to, żeby produkować się z opisywaniem jakichś faktycznych parametrów i właściwości fizykochemicznch, tylko po prostu jakieś zdanie wzmianki, że substancje te mają jakieś właściwości, które można opisać za pomocą liczb, dane te można zmierzyć eksperymentalnie i wszystkie razem wpływają one na skuteczność leku.
Słusznie - poprawiam.
17  Koło Naukowe / Portal z zadaniami / Optymalizacja rozwiązania a. k. a. Projektowanie leków trochę inaczej : Marca 09, 2015, 02:01:56
Optymalizacja rozwiązania a. k. a. Projektowanie leków trochę inaczej

---------------------------------------------------------------------------------------------------------------------------------
Na wstępie powiem, że to takie zadanie - eksperyment. Ma ono na celu... (To uzupełnię dopiero po wypowiedziach minimum 3 osób, bo nie chcę na razie niczego sugerować). Będę bardzo wdzięczny za 2 opinie:
1. Czy tego typu "opowiastkowy" ton w zadaniu jest OK, czy lepiej z niego zrezygnować?
2. Co sądzicie o tym zadaniu? Czego wg Was uczy?
---------------------------------------------------------------------------------------------------------------------------------

#Bioinformatyk Janek jest w trakcie opracowywania leku na lenistwo.
Lek składa się z 9 składników:
Dwóch substancji aktywnych (a1 i a2),
Trzech substancji pomocnicznych (p1, p2, p3),
Dwóch substancji ułatwiających wchłanianie (w1, w2),
Substancji odpowiadającej za smak leku (s),
Substancji odpowiadającej za kolor tabletki (k).

Substancje te mają właściwości, które można opisać za pomocą liczb. Dane te można zmierzyć eksperymentalnie i wszystkie razem wpływają na skuteczność leku.
Janek na podstawie wstępnych analiz stworzył model opisujący skuteczność leku w zależności od wybranych substancji:



Następnie, przetestował wszystkie możliwe substancje, w każdej grupie składników, pod kątem skuteczności i zapisał wyniki (w formie gotowej do podstawienia do powyższego wzoru) w plikach o następującym formacie:

ID_SUBSTANCJI      WYNIK
1            0.94112
2            0.4521
3            0.62236
…            …

Pozostało mu tylko wybrać optymalną #kombinację substancji. Jest ich jednak trochę (565 573 496 278 855 282 348 032) za dużo, aby wszystkie sprawdzić w laboratorium. Janek napisał więc skrypt w Pythonie, który oblicza skuteczność leku na podstawie stworzonego wcześniej modelu. Program daje poprawny wynik dla małych zestawów danych, jednak dla bazy stworzonej przez Janka liczyłby się zdecydowanie za długo (dolne oszacowanie to milion lat). Janek (lek miał służyć także jemu) jest tym faktem załamany, bo nie chce mu się pisać programu od nowa, a pracował nad nim ponad dekadę.

Pobierz skrypt Janka oraz bazę danych skuteczności substancji i postaraj się mu pomóc (zoptymalizować rozwiązanie tak, aby uzyskać wynik w bardziej rozsądnym niż milion lat czasie).

Jako odpowiedź podaj ID_SUBSTANCJI optymalnej substancji dla wszystkich grup składników (w przypadku równie dobrych kombinacji wybierz dowolną) w poniższej kolejności:

a1, a2, p1, p2, p3, w1, w2, s, k

---------------------------------------------------------------------------------------------------------------------------------
P.S. Czy jest jakaś szybsza/lepsza droga wstawienia ładnego wzoru na forum niż ta, którą ja przyjąłem?
18  Koło Naukowe / Portal z zadaniami / Odp: Optymalizacja złożoności / długości kodu : Marca 09, 2015, 01:41:52
Koncepcja wyewoluowała w inną (którą zaraz się pochwalę), ale na konkretnie TEN pomysł przyjdzie jeszcze czas... Póki co zdejmuję rezerwację.
19  Koło Naukowe / Portal z zadaniami / Odp: Analiza wyników badań krwi : Marca 06, 2015, 02:29:50
Najbardziej rażą mnie teraz te dwie spacje w "Śr. wielkość erytrocytu", ale z drugiej strony zmuszą one użytkownika do zajrzenia do pliku i pogłówkowania... Zamienić je na podkreślniki, czy zostawić spacje?
20  Koło Naukowe / Portal z zadaniami / Odp: Zasady : Marca 04, 2015, 10:28:32
Moim zdaniem warto je oddzielić dla lepszej organizacji, ale z przyczyn wiadomych proponuję póki co bardziej skupić się na zadaniach.
21  Koło Naukowe / Portal z zadaniami / Odp: Alignment + drzewo : Marca 03, 2015, 08:17:17
Cytuj
Przykładowo, sekwencje hemoglobiny (białka umożliwiającego czerwonym krwinkom transportowanie żelaza)(...)
tlenu  Mrugnięcie

Generalnie bardzo zacne zadanie, mocno zhasztagowane, więc sporo uczące  Uśmiech
22  Koło Naukowe / Portal z zadaniami / Odp: Analiza wyników badań krwi : Marca 03, 2015, 02:00:22
Dzięki za rzetelną odpowiedź Uśmiech
Uświadomiłaś mi, że zrobiłem format pliku do oglądania, a nie do analizy. Tak jak mówisz - pozytywny skutek uboczny jest taki, że to może być uczące dla rozwiązującego zadanie. Jeśli jednak ktoś stwierdzi, że absolutnie trzeba to zmienić, to też nie ma problemu Uśmiech
23  Koło Naukowe / Portal z zadaniami / Odp: Analiza wyników badań krwi : Marca 03, 2015, 12:25:06
Wczoraj napisałem w pudełku, że dodam dane i oto są.
Myślę, że są znakomitą odpowiedzią na pytania  Mrugnięcie
Zadanie jest z grubsza gotowe. Zapewne nie obejdzie się bez poprawek przy dodawaniu zadania do serwisu, ale to co widać można uznać za wersję alfa - przekazuję do hejtowania testowania.

Z innej beczki:
Czy jest jakiś bardziej elegancki sposób na utrzymanie formatowania pliku (tj. "ładnego podziału na kolumny"), tak aby nie był zależny od szerokości tabulacji inny niż "ospacjowanie"? Albo inaczej - co zrobić, aby plik pokroju .pdb czy tych z zadania wyglądał pięknie w każdym edytorze?
24  Koło Naukowe / Portal z zadaniami / Odp: Analiza wyników badań krwi : Marca 02, 2015, 01:19:29
Analiza wyników badania krwi

CBC (complete blood count), czyli morfologia krwi, to badanie polegające na ilościowym i jakościowym pomiarze #składników krwi.



Pobierz wyniki (uproszczonego) badania CBC tysiąca pacjentów i napisz program, który znajdzie wszystkie osoby (numery identyfikacyjne pacjentów):
   a) których wyniki są nieprawidłowe (przynajmniej jeden parametr jest poza normą),
   b) które są w stanie krytycznym. Przyjmijmy, że stan krytyczny występuje, gdy spełniony    jest co najmniej jeden z poniższych warunków:
   - przynajmniej jeden parametr ma wartość o 20% niższą od minimum lub 20% wyższą od    maksimum,
   - przynajmniej dwa parametry mają wartość o 10% niższą od minimum lub 10% wyższą od    maksimum,
   - przynajmniej trzy parametry są poza normą.
Zauważ, że pacjent, który jest w stanie krytycznym ma w szczególności nieprawidłowe wyniki, ale pacjent, który ma nieprawidłowe wyniki nie musi być w stanie krytycznym.



Plik z wynikami badań pacjenta ma następującą formę:

Parametr                                   Wynik      Norma         Jednostka
-------------------------------------------------------------------------------
Płeć                                          K           -                 -
Erytrocyty                                 4.9           4.2 – 5.4     [mln kom./µl]
Leukocyty                                 7.2           4.5 – 9.9      [tys. kom./µl]
Hematokryt                              42.1          36.1 – 44.3 [%]
Hemoglobina                            15.0          12.1 – 15.1 [g/dl]
Śr. wielkość erytrocytu              82             80-95         [fl]



Za normę przyjmijmy następujące wartości (http://www.nlm.nih.gov/medlineplus/ency/article/003642.htm [dostęp 02 III 2015]):

Ilość milionów czerwonych krwinek na mikrolitr krwi:         
Mężczyzna         4.7 – 6.1   
Kobieta             4.2 – 5.4

Ilość tysięcy białych krwinek na mikrolitr krwi:            
                       4.5 – 9.9    (wartość taka sama dla obu płci)

Stosunek objętości czerwonych krwinek do objętości krwi:
Mężczyzna       40.7 – 50.3
Kobieta           36.1 – 44.3

Waga (w gramach) hemoglobiny znajdującej się w decylitrze krwi:
Mężczyzna      13.8 – 17.2
Kobieta           12.1 – 15.1

Przeciętna wielkość (w femtolitrach) czerwonej krwinki:
                     80-95      (wartość taka sama dla obu płci)

Zauważ, że niektóre wartości są zależne od płci.

-----------------------------------------------------------------------------------------------
Przykład odpowiedzi:
Wyniki nieprawidłowe:    1,2,3,4,5,999
Wyniki krytyczne:          1,4,999
//Użytkownik będzie musiał wpisać kolejno ID pacjentów do dwóch okienek, które będą na stronie z zadaniem (mam nadzieję, że to nie będzie problem. Jeśli tak, dostosuję format odpowiedzi do mechanizmu strony)
25  Koło Naukowe / Portal z zadaniami / Odp: ChIP-seq : Marca 01, 2015, 10:33:58
Bardzo podoba mi się pomysł z zaznaczaniem pojęć do wytłumaczenia. Zwykłymi hiperłączami będzie można odsyłać czytelnika do mini-encyklopedii, którą chcąc nie chcąc stworzymy. Proponuję "podkleić" ten pomysł w temacie z zasadami (tj. niech każdy hashtaguje pojęcia do wytłumaczenia).

A i zadanie b. fajne Uśmiech
26  Koło Naukowe / Portal z zadaniami / Odp: Parser FASTY : Lutego 19, 2015, 12:17:04
To prawda PDB jest trochę "ciekawszym" formatem, ale jak się odfiltruje wszystkie linikji, które nie zaczynają się od "ATOM", to nawet idzie coś z tego wyliczyć Uśmiech

Ostatnio trafiłem na oficjalny manual do .pdb - miał ponad 150 stron  Chichot
27  Koło Naukowe / Portal z zadaniami / Odp: Analiza wyników badań krwi : Lutego 15, 2015, 07:49:55
Mam na to pomysł (wkrótce go rozpiszę).

Także generalnie:
REZERWACJA
28  Koło Naukowe / Portal z zadaniami / Odp: Optymalizacja złożoności / długości kodu : Lutego 15, 2015, 07:47:40
Chyba mam pomysł jak to zadanie "zbioinformatyzować" i sprawić, aby było proste do sprawdzenia (za jakiś czas to wytłumaczę).

Także generalnie:
REZERWACJA EDIT: ODWOŁANA
29  Koło Naukowe / Portal z zadaniami / Odp: Parser FASTY : Lutego 15, 2015, 07:44:44
Pomyślałem, że można by rozwinąć pomysł i zrobić taki "mini-kombajn" do fasty.
User dostaje od nas plik z sekwencją (w przyszłości będzie można pomyśleć o jakimś generatorze, albo przynajmniej o losowaniu spośród 1000 w bazie) i musi wyliczyć GC-content, znaleźć TATA-box'y, kodony startu i stopu, ilość niedokładnie określonych nukleotydów itd., a potem zapisać wyniki w ściśle określony sposób do pliku.

Także generalnie:
REZERWACJA

Analogiczne zadanie będzie (edit:) można poczynić do formatu .pdb
30  Koło Naukowe / Portal z zadaniami / Odp: Nazwa portalu : Stycznia 25, 2015, 01:17:27
Od siebie dodam tylko, że przy każdej nazwie można dopisać (Projekt). I mean,
Akacja brzmi równie dobrze co Projekt Akacja
Synapsa brzmi równie dobrze co Projekt Synapsa
i tak jest z większością nazw Uśmiech
Nie wiem, czy Pelikan i Tralala może jakkolwiek konkurować z Synapsą, czy da Vincim...
InterFlorek > Eklerek, Rekinek itd.
Strony: 1 [2] 3

SimplePortal 2.3.1 © 2008-2009, SimplePortal