نرم افزار 123FASTQ; جامع ترین راه آنالیز فایلهای FASTQ
دانلود مستقیم نرمافزار 123FASTQ
با توجه به گسترش روزافزون روشهای توالییابی و حجم عظیم اطلاعات حاصل از آن و غیرممکن بودن آنالیز دستی این حجم از اطلاعات، نیاز به استفاده از کامپیوترها از ابتدای راه ابداع توالییابی نسل بعد موردتوجه بوده است. تا به امروز با بهرهگیری از زبانهای مختلف برنامهنویسی ازجمله Perl, C++, JAVA, Python… نرمافزارهای متعددی تحت پلتفرمهای مختلف ازجمله Unix,Windows,Web,… برای مراحل مختلف آنالیز دادههای حاصل از توالییابی نوشتهشدهاند که هرکدام معایب و مزایای خاص خود را دارند. تمرکز ما در برنامه نویسی ابزار 123Fastq که جزئی از خانواده 123NGS است، بر روی آنالیزهای مربوط به فایل FASTQ است.
بهطورمعمول سه مرحله آنالیز بر روی هر فایل FASTQ انجام میدهیم که شامل بررسی کیفیت فایل، برش و تمیزکاری (Trimming) فایل و درنهایت بررسی دوباره کیفی فایل تمیزکاری شده است. انجام صحیح این مراحل میتواند به بهبود آنالیزهای بعدی در مسیر توالییابی کمک کند. چرا که با حذف خوانشهای با کیفیت پایین (و یا قسمت هایی از خوانشها که کیفیتشان پایین است) که احتمال اشتباه بودنشان بالاتر است و یا با حذف قسمتهایی از خوانشها که دارای توالیهای تکنیکی مثل آداپتورها هستند، خوانشها با درصد بالاتری به نواحی درست ردیفیابی میشوند. البته بایستی از کوتاه شدن بیش از اندازه خوانشها نیز جلوگیری کرد، زیرا این مسئله باعث افزیش دفعات ردیفیابی هر خوانش در ژنوم مرجع میشود. تا به امروز ابزارهای مختلفی برای هرکدام از این مقاصد به وجود آمدهاند اما ابزاری که همهی این امور را بهطور کامل پوشش دهد و از سهولت در استفاده نیز برخوردار باشد، وجود ندارد. بهعنوانمثال برخی نرمافزارها وجود دارند که تنها کنترل کیفی را بهخوبی انجام میدهند اما در عمل برش و تمیزکاری فایل ناتوان هستند و همچنین ابزارهایی نیز وجود دارند که عمل برش و تمیزکاری را بهخوبی انجام میدهند اما از انجام کنترل کیفیت و نمایش گزارش عاجز هستند. در این میان ابزارهایی نیز وجود دارند که مشکلات تحت شبکه بودن یا انجام نادرست وظایف بر محبوبیت آنها تأثیر گذاشته است. در بخش بعد به بررسی اکثر ابزارهای موجود و شناخته شده در این حوزه میپردازیم.
برنامه 123Fastq دارای قابلیت های بسیاری در حوزه کنترل کیفیت، برش و تمیزکاری فایل FASTQ، تشخیص بارکدهای توالییابی، تغییر فرمت فایلها با مقصد FASTQ میباشد. بدیهی است در آینده ممکن است بهبودهایی در عملکرد قابلیتهای حال حاضر آن رخ دهد و یا قابلیت های جدیدی به آن افزوده شود. گفتنی است با توجه به حجم وسیع کدهای نوشته شده در برنامه 123Fastq (بالغ بر 25000 خط کد) در قالب این متن نمیگنجد تا به همهی الگوریتمهای به کار رفته با جزئیات پرداخت، در نتیجه بیشتر به قابلیت های کاربردی این برنامه می پردازیم و نحوه استفاده و تفسیر نتایج آن را بیان میکنیم.
1 دیدگاه
Everything is very open with a precise clarification of the challenges. It was really informative. Your website is useful. Thanks for sharing!