Strony: [1]
  Drukuj  
Autor Wątek: Procentowy udział AA w rodzinie białek  (Przeczytany 1760 razy)
maciosz
Administrator
Hero Member
*****
Wiadomości: 723


5564019
Zobacz profil Email
« : Grudnia 19, 2014, 05:56:38 »

Procentowy udział AA w rodzinie białek

Mamy rodzinę białek; pytamy o procentowy udział np. aminokwasów hydrofobowych w białkach tej rodziny.

Uwaga: jeżeli na wejściu podajemy tylko nazwę rodziny trzeba pamiętać, że odpowiedź się będzie deaktualizować w miarę odkrywania nowych białek. Jeżeli podajemy po prostu bazę białek to spoko.
« Ostatnia zmiana: Marca 10, 2015, 12:06:37 wysłane przez maciosz » Zapisane

Chaos zawsze pokonuje porządek, gdyż jest lepiej zorganizowany.
Terry Pratchett
Behoston
Administrator
Sr. Member
*****
Wiadomości: 374


277797 mati-20
Zobacz profil WWW Email
« Odpowiedz #1 : Lutego 10, 2015, 11:35:12 »

mogę się podjąć
Zapisane

Ilu bioinformatyków potrzeba do wkręcenia żarówki? Żadnego, bo i tak nie ma prądu.
Behoston
Administrator
Sr. Member
*****
Wiadomości: 374


277797 mati-20
Zobacz profil WWW Email
« Odpowiedz #2 : Marca 07, 2015, 12:03:02 »

W zależności od możliwości naszej platformy można by to zrobić w ten sposób że jeśli wynik się nie zgadza to skrypt na naszym serwerze aktualizuje prawidłowy wynik i sprawdza raz jeszcze.
A możliwości będą (bo to chyba django), będzie można uruchomić dowolny pythonowy skrypt. Z chęcią go napiszę jak tylko będę wiedział jak wygląda pisanie tego żeby działało Język (chociaż w sumie to napiszę może skrypt uruchamiany z palca)

Czy nie lepiej pytać np. o to jakie kodony są używane w danej rodzinie białek najczęściej dla jakiegoś aminokwasu?

Kinezyny, jedyna ciekawa rodzina białek która przychodzi mi na myśl (po krótkim przeszukaniu pfam nic nie znalazłem ciekawego, ponadto mają strasznie złą przeglądarkę rodzin bo wyświetla też domeny i nie idzie tego nijak odfiltrować/posortować)
http://pfam.xfam.org/family/PF00225

choć nie wiem czy to dobry pomysł. Ale przekonajmy się w praktyce Język rodzinę zawsze można zmienić (choć podobno rodziny się nie wybiera :p ).
« Ostatnia zmiana: Marca 07, 2015, 03:19:10 wysłane przez Behoston » Zapisane

Ilu bioinformatyków potrzeba do wkręcenia żarówki? Żadnego, bo i tak nie ma prądu.
Behoston
Administrator
Sr. Member
*****
Wiadomości: 374


277797 mati-20
Zobacz profil WWW Email
« Odpowiedz #3 : Marca 07, 2015, 03:52:08 »

Białka, jak już zapewne wiesz, zbudowane są z aminokwasów (istnieje 20 podstawowych + kilka dodatkowych ale nimi się zajmować nie będziemy). Każde białko ma inną sekwencję aminokwasową ale niektóre są do siebie podobne. Można powiedzieć (uogólniając), że takie podobne do siebie białka należą do jednej rodziny.

Każdy aminokwas ma swoje właściwości takie jak ładunek (dodatni, obojętny lub ujemny), polarność itd.. Dość istotnym parametrem jest hydrofobowość (hydro - woda, phobos - strach). Jeśli aminokwas jest hydrofobowy to "stara się" unikać wody. Najczęściej tego typu aminokwasy występują wewnątrz struktury białek osłonięte innymi aminokwasami które są hydrofilowe (lubiące wodę).

Jako, że rodziny białkowe wykazują wewnątrz grupy podobieństwa w tym zadaniu postaramy się zbadać czy pewna rodzina białek ma podobny stosunek proporcji aminokwasów hydrofobowych do hydrofilowych.

Będziemy zajmować się nieprzypadkową rodziną - kinezynami. Ta grupa białek odpowiada za np. przenoszenie w komórce pęcherzyków z różnymi substancjami w różne miejsca. Podróżują one po szkielecie wewnątrz komórki (mikrotubulach).
<tu wstaw grafikę z posta wyżej>

Najprostszym sposobem znalezienia tej rodziny białek w internecie będzie po prostu wpisanie w Google zapytania
Kod:
Kinesin
(przy okazji wyszukiwania w Google zwróć uwagę na znalezione filmy)
Pierwszy odnośnik powinien prowadzić do anglojęzycznej strony Wikipedii na której znajduje się link do bazy Pfam w której można odnaleźć cały zbiór białek z tej rodziny (prawie 10 tysięcy sekwencji).
Na stronie można znaleźć sekwencje białek i pobrać je w pasującym Ci formacie <odnośnik do formatów>.
Możesz pobrać sekwencje bez wstawionych przerw, plik będzie mniejszy a jego interpretacja może okazać się łatwiejsza. Polecamy format FASTA (format Selex też nie będzie zły).
Wystarczy, że zbadasz "Seed", nie musisz pobierać wszystkich sekwencji.
Napisz program który policzy odchylenie standardowe dla proporcji hydrofobowe/hydrofilowe.
Zastanów się na podstawie grafik/filmów znalezionych przy okazji szukania rodziny czemu stosunek jest w ten sposób odchylony od równej proporcji.

kod do zadania:
Kod:
lista=[]
fobo=['A','F','I','L','M','V','W','Y']
with open('seq.txt','r') as seq:
    licznik=-1
    for linia in seq:
        licznik+=1
        linia=linia.strip().split()
        ile=0.0
        for aminokwas in linia[1]:
            if aminokwas in fobo:
                ile+=1
        lista.append(ile/len(linia[1]))
avg=sum(lista)/len(lista)
o=0
for wynik in lista:
    o+=(wynik-avg)**2
o=(o/len(lista))**0.5
średnia: 0.3658551607512851
odchylenie standardowe: 0.018403790736100538
więc jest tak jak się spodziewałem Chichot
jeszcze można pokusić się o kodony albo dorzucić jakiś wykres ale tego nie sprawdzimy
możemy też dać jakąś bardziej hydrofobową rodzinę lub w ogóle więcej rodzin do przebadania bo jak dla mnie zajmuje to jakieś 20 minut max całość.

dla całej rodziny jest to odpowiednio, więc na seed tym lepiej wychodzi przynajmniej odchylenie:
0.35712537566332536
0.03230739553282199
« Ostatnia zmiana: Marca 07, 2015, 05:06:53 wysłane przez Behoston » Zapisane

Ilu bioinformatyków potrzeba do wkręcenia żarówki? Żadnego, bo i tak nie ma prądu.
maciosz
Administrator
Hero Member
*****
Wiadomości: 723


5564019
Zobacz profil Email
« Odpowiedz #4 : Marca 09, 2015, 12:38:11 »

Oki Loki, spoko zadanie, mam tylko kilka uwag do rozważenia:

1. Może można by napisać co to jest to seed, na Pfamie jest informacja, że to "the curated alignment from which the HMM for the family is built", to brzmi jak jakieś abrakadabra jak się pierwszy raz widzi na oczy skrót HMM.
2. Na pewno trzeba będzie co najmniej zrobić hashtag #odchylenie standardowe, gdzie będzie instrukcja jak go policzyć. Można też dać takową instrukcję od razu w treści zadania. Oczywiście można by chcieć, żeby użytkownik sam poszukał, ale primo może go zniechęcić, jak za dużo rzeczy będzie do szukania, secundo znajdzie dwa wzory na odchylenie: jedno z dzieleniem przez n, drugie z dzieleniem przez (n-1) i nie będzie wiedział, który ma użyć. Więc lepiej mu powiedzieć.
3. Rozumiem, że znalezienie, jakie aminokwasy są hydrofobowe pozostawiamy celowo użytkownikowi? Może to mieć sens.
4. Komplikowanie zadania poprzez dodawanie analizy kodonów, więcej rodzin etc. nie ma moim zdaniem sensu. I tak zadanie mam wrażenie że brzmi na kosmiczne dla licealisty, musi wchodzić na jakiś serwis Pfam cały po angielsku, szukać gdzie coś kliknąć etc. Toż ja na bioinf1 byłam zdezorientowana i sfrustrowana takimi poleceniami, nie potrzebowałam dodatkowego komplikowania żeby uważać je za swego rodzaju wyzwanie. Jest to też na bank pierwsze dla niego zetknięcie z pojęciem "rodzina białek", być może również z pojęciem "aminokwas hydrofobowy", a może nawet "aminokwas" i "białko", więc trzeba mu dać czas na oswojenie się z tymi pojęciami i nie kazać zaraz robić jakichś szalonych rzeczy.
5. Przyznaję się, że jeszcze nie przeanalizowałam kodu i w związku z tym poprawności rozwiązania, ale może tym zajmie się już później tester.

No i chyba tyle.
Przypuszczam, że jak przejdziemy do faktycznego testowania wszystkich zadań to przy okazji tester będzie zgłaszał jeszcze jakieś inne, bardziej czepialskie uwagi, w stylu "pokazałem to zadanie znajomej która nie wie co to jest białko i się przestraszyła tej treści, może można by dodać krótkie zdanie o tym-i-o-tym".
Zapisane

Chaos zawsze pokonuje porządek, gdyż jest lepiej zorganizowany.
Terry Pratchett
Behoston
Administrator
Sr. Member
*****
Wiadomości: 374


277797 mati-20
Zobacz profil WWW Email
« Odpowiedz #5 : Marca 09, 2015, 06:16:24 »

1. Tak zrobię
2. jw
3. Szczerze to miałem dopisać ale można dać w okienku "podpowiedź"
4. Etam Język mogę zrobić cześć 2 tego zdania...
5. Nie wiem czy jest sens publikować rozwiązania, czy dawać prywatnie testerowi
Zapisane

Ilu bioinformatyków potrzeba do wkręcenia żarówki? Żadnego, bo i tak nie ma prądu.
Behoston
Administrator
Sr. Member
*****
Wiadomości: 374


277797 mati-20
Zobacz profil WWW Email
« Odpowiedz #6 : Maja 04, 2015, 01:06:53 »

Moja mała kopia bezpieczeństwa przed wciśnięciem przycisku "Podgląd"
Jak się okazuje... była konieczna -_-

Kod:


<h1>Wprowadzenie</h1>

<p>#Białka, jak już zapewne wiesz, zbudowane są z #aminokwasów (istnieje 20 podstawowych + kilka dodatkowych ale nimi się zajmować nie będziemy). Każde białko ma inną sekwencję aminokwasową ale niektóre są do siebie podobne. Można powiedzieć (uogólniając), że takie podobne do siebie białka należą do jednej rodziny. Najczęściej takie białka pełnią podobne funkcje.</p>

<p>Każdy aminokwas ma swoje właściwości takie jak #ładunek (dodatni, obojętny lub ujemny), #polarność itd.. Dość istotnym parametrem jest #hydrofobowość (hydro - woda, phobos - strach). Jeśli aminokwas jest hydrofobowy to "stara się" unikać wody. Najczęściej tego typu aminokwasy występują wewnątrz struktury białek osłonięte innymi aminokwasami które są #hydrofilowe (lubiące wodę).</p>

<p>Jako, że rodziny białkowe wykazują wewnątrz grupy podobieństwa w tym zadaniu postaramy się zbadać czy pewna rodzina białek ma podobny stosunek proporcji aminokwasów hydrofobowych do hydrofilowych.</p>

<h1>Zadanie</h1>

<p>Będziemy zajmować się nieprzypadkową rodziną - kinezynami. Ta grupa białek odpowiada za np. przenoszenie w komórce pęcherzyków z różnymi substancjami w różne miejsca. Podróżują one po szkielecie wewnątrz komórki (#mikrotubulach).<br />
<img alt="tu była fajna animacja stepiny ale nie ma :(" src="http://x3.cdn03.imgwykop.pl/c3201142/comment_X8YnJtVVanaH3nciKq7kUnDkbIa7s3Hu.gif" style="height:256px; width:256px" /><br />
Najprostszym sposobem znalezienia tej rodziny białek w internecie będzie po prostu wpisanie w Google zapytania:</p>

<blockquote>
<p>kinesin</p>
</blockquote>

<p>(przy okazji wyszukiwania w Google zwróć uwagę na znalezione filmy)<br />
Pierwszy odnośnik powinien prowadzić do anglojęzycznej strony Wikipedii na której znajduje się link do bazy <strong>#Pfam</strong> w której można odnaleźć cały zbiór białek z tej rodziny (prawie 10 tysięcy sekwencji).<br />
Na stronie można znaleźć sekwencje białek i pobrać je w pasującym Ci #formacie.<br />
Możesz pobrać sekwencje bez wstawionych przerw, plik będzie mniejszy a jego interpretacja może okazać się łatwiejsza. Polecamy format #FASTA (format Selex też nie będzie zły).<br />
Wystarczy, że zbadasz "Seed", nie musisz pobierać wszystkich sekwencji.</p>

<p>Napisz program który policzy odchylenie standardowe dla proporcji hydrofobowe/hydrofilowe.<br />
Zastanów się na podstawie grafik/filmów znalezionych przy okazji szukania rodziny czemu stosunek jest w ten sposób odchylony od równej proporcji.</p>


Zapisane

Ilu bioinformatyków potrzeba do wkręcenia żarówki? Żadnego, bo i tak nie ma prądu.
Strony: [1]
  Drukuj  
 
Skocz do:  


SimplePortal 2.3.1 © 2008-2009, SimplePortal