Strony: [1]
  Drukuj  
Autor Wątek: Optymalizacja rozwiązania a. k. a. Projektowanie leków trochę inaczej  (Przeczytany 2045 razy)
pjankowski
Student
Full Member
***
Wiadomości: 237



Zobacz profil Email
« : Marca 09, 2015, 02:01:56 »

Optymalizacja rozwiązania a. k. a. Projektowanie leków trochę inaczej

---------------------------------------------------------------------------------------------------------------------------------
Na wstępie powiem, że to takie zadanie - eksperyment. Ma ono na celu... (To uzupełnię dopiero po wypowiedziach minimum 3 osób, bo nie chcę na razie niczego sugerować). Będę bardzo wdzięczny za 2 opinie:
1. Czy tego typu "opowiastkowy" ton w zadaniu jest OK, czy lepiej z niego zrezygnować?
2. Co sądzicie o tym zadaniu? Czego wg Was uczy?
---------------------------------------------------------------------------------------------------------------------------------

#Bioinformatyk Janek jest w trakcie opracowywania leku na lenistwo.
Lek składa się z 9 składników:
Dwóch substancji aktywnych (a1 i a2),
Trzech substancji pomocnicznych (p1, p2, p3),
Dwóch substancji ułatwiających wchłanianie (w1, w2),
Substancji odpowiadającej za smak leku (s),
Substancji odpowiadającej za kolor tabletki (k).

Substancje te mają właściwości, które można opisać za pomocą liczb. Dane te można zmierzyć eksperymentalnie i wszystkie razem wpływają na skuteczność leku.
Janek na podstawie wstępnych analiz stworzył model opisujący skuteczność leku w zależności od wybranych substancji:



Następnie, przetestował wszystkie możliwe substancje, w każdej grupie składników, pod kątem skuteczności i zapisał wyniki (w formie gotowej do podstawienia do powyższego wzoru) w plikach o następującym formacie:

ID_SUBSTANCJI      WYNIK
1            0.94112
2            0.4521
3            0.62236
…            …

Pozostało mu tylko wybrać optymalną #kombinację substancji. Jest ich jednak trochę (565 573 496 278 855 282 348 032) za dużo, aby wszystkie sprawdzić w laboratorium. Janek napisał więc skrypt w Pythonie, który oblicza skuteczność leku na podstawie stworzonego wcześniej modelu. Program daje poprawny wynik dla małych zestawów danych, jednak dla bazy stworzonej przez Janka liczyłby się zdecydowanie za długo (dolne oszacowanie to milion lat). Janek (lek miał służyć także jemu) jest tym faktem załamany, bo nie chce mu się pisać programu od nowa, a pracował nad nim ponad dekadę.

Pobierz skrypt Janka oraz bazę danych skuteczności substancji i postaraj się mu pomóc (zoptymalizować rozwiązanie tak, aby uzyskać wynik w bardziej rozsądnym niż milion lat czasie).

Jako odpowiedź podaj ID_SUBSTANCJI optymalnej substancji dla wszystkich grup składników (w przypadku równie dobrych kombinacji wybierz dowolną) w poniższej kolejności:

a1, a2, p1, p2, p3, w1, w2, s, k

---------------------------------------------------------------------------------------------------------------------------------
P.S. Czy jest jakaś szybsza/lepsza droga wstawienia ładnego wzoru na forum niż ta, którą ja przyjąłem?
« Ostatnia zmiana: Marca 10, 2015, 12:05:20 wysłane przez maciosz » Zapisane
maciosz
Administrator
Hero Member
*****
Wiadomości: 724


5564019
Zobacz profil Email
« Odpowiedz #1 : Marca 09, 2015, 10:27:33 »

Opowiastkowy ton bardzo mi się podoba Uśmiech Wydaje mi się, że bardziej przyciąga uwagę i sprawia, że to, co jest opisane w zadaniu zaczyna sprawiać wrażenie rzeczywiście praktycznego i przydatnego na codzień; nie są to wtedy dla rozwiązującego jakieś abstrakcyjne zagadnienia.

Troszkę brakuje mi wprost powiedzianego, co właściwie oznaczają te liczby - w sensie dobrze rozumiem i bez tego o co chodzi w zadaniu i czego się ode mnie chce, ale co to właściwie znaczy, że substancja o ID 1 ma wartość 0.15? Nie chodzi mi o to, żeby produkować się z opisywaniem jakichś faktycznych parametrów i właściwości fizykochemicznch, tylko po prostu jakieś zdanie wzmianki, że substancje te mają jakieś właściwości, które można opisać za pomocą liczb, dane te można zmierzyć eksperymentalnie i wszystkie razem wpływają one na skuteczność leku.

Hm, zadanie nauczyło mnie kilku rzeczy:
a) mimo iż bioinformatyk Janek umie1 programować nie umie przyjrzeć się wzorowi i logicznie wnioskować
b) bioinformatycy czasem piszą listy zakupów w swoich skryptach, zwłaszcza jak są leniwi
c) zamiast bezmyślnie klepać najbardziej brute-force'owe skrypty jakie można sobie wyobrazić zawsze warto przystanąć chwilę i sprawdzić, czy nie da się znaleźć rozwiązania po prostu przyglądając się zagadnieniu (ważna nauka zwłaszcza dla leni)
d) czasem do podpunktu c) przydaje się ogarnianie matematyki, chociażby w stopniu wystarczającym żeby rozkminić co ma być większe, a co mniejsze żeby zmaksymalizować wyrażenie
e) Janek dostał cholernie duży grant, skoro zbadał prawie 12 tys. związków! Mrugnięcie
f) brak dialogu między naukowcami różnych dziedzin oraz wąskie wyspecjalizowanie poszczególnych naukowców znacząco utrudnia badania (gdyby Janek poprosił kogoś wcześniej o pomoc nie straciłby dekady na swój skrypt, albo gdyby sam był chociaż trochę obyty z matematyką)

Podsumowując, zadanie bardzo mi się podoba, trzeba przy nim chwilę pomyśleć, nie ma się na talerzu podane co właściwie trzeba zrobić; trzeba naprawdę zastanowić się nad rozwiązaniem, które w gruncie rzeczy jest proste, więc nie jest też tak, że od tego zadanie się zrobiło za trudne.

Wzory chyba można było pisać w otoczeniu kod w latexu, ale coś mi to nie działa, więc jeszcze poszukam.

1Ok, w sumie programować też nie umie, skoro pisał skrypt 10 lat Chichot To już mniej mnie dziwi. Tylko czy w takim razie godny jest nazywania się bioinformatykiem?...
« Ostatnia zmiana: Marca 09, 2015, 10:29:30 wysłane przez maciosz » Zapisane

Chaos zawsze pokonuje porządek, gdyż jest lepiej zorganizowany.
Terry Pratchett
pjankowski
Student
Full Member
***
Wiadomości: 237



Zobacz profil Email
« Odpowiedz #2 : Marca 09, 2015, 04:23:29 »

Cytuj
Troszkę brakuje mi wprost powiedzianego, co właściwie oznaczają te liczby - w sensie dobrze rozumiem i bez tego o co chodzi w zadaniu i czego się ode mnie chce, ale co to właściwie znaczy, że substancja o ID 1 ma wartość 0.15? Nie chodzi mi o to, żeby produkować się z opisywaniem jakichś faktycznych parametrów i właściwości fizykochemicznch, tylko po prostu jakieś zdanie wzmianki, że substancje te mają jakieś właściwości, które można opisać za pomocą liczb, dane te można zmierzyć eksperymentalnie i wszystkie razem wpływają one na skuteczność leku.
Słusznie - poprawiam.
Zapisane
Behoston
Administrator
Sr. Member
*****
Wiadomości: 374


277797 mati-20
Zobacz profil WWW Email
« Odpowiedz #3 : Maja 04, 2015, 02:23:14 »

Sypnęło Ci się coś z formatowaniem tekstu (jest szare tło, czcionka nie jest domyślna i jest mniejsza), tex działa przez $ tu wpisz tex $ tak sądzę
Cytuj
Mathematics inside the configured delimiters is rendered by MathJax. The default math delimiters are $$...$$ and \[...\] for displayed mathematics, and $...$ and \(...\) for in-line mathematics.
Zapisane

Ilu bioinformatyków potrzeba do wkręcenia żarówki? Żadnego, bo i tak nie ma prądu.
pjankowski
Student
Full Member
***
Wiadomości: 237



Zobacz profil Email
« Odpowiedz #4 : Maja 05, 2015, 07:05:49 »

Pragnę zauważyć, że serwis jeszcze jest w fazie testów i czasem mogą się na nim pojawiać rzeczy, które są niedokończone  Język
Zapisane
Strony: [1]
  Drukuj  
 
Skocz do:  


SimplePortal 2.3.1 © 2008-2009, SimplePortal