22-05-2021, 09:52 PM
پردازش الکترونیکی اطلاعات
ذخیره داده
اولین کامپیوترهای الکترونیکی مانند Colossus از نوار پانچ استفاده میکردند که نوار بلند کاغذی بود که سری سوراخهای روی آن، نمایانگر اطلاعات بودند. در حال حاضر این تکنولوژی منسوخ شده است. پیشینهی حافظهی الکترونیکی که در کامپیوترهای مدرن استفاده میشود به زمانی برمیگردد که در جنگ جهانی دوم یک نوع حافظهی تأخیر خط برای حذف در هم ریختگی در سیگنال رادارها ساخته شد. اولین کاربرد عملی آن تأخیر خط جیوه بود. اولین حافظه تصادفی دیجیتالی، Williams tube نام داشت که استاندارد آن بر اساس پرتوی لامپ کاتدی بود اما اطلاعات ذخیره شده روی آن و حافظهی تأخیر خط، فرّار بود که باید به طور مداوم تازه میشد و در نتیجه پس از هربار قطع برق، از بین میرفت. اولین کامپیوتر که حافظهی آن فرّار نبود، magnetic drum نام داشت که در سال 1932 اختراع شد که در Ferranti Mark 1 ، اولین کامپیوتری که به فروش عمومی رسید، استفاده میشد.
IBM در سال 1956 اولین هارد دیسک خود را به عنوان جزئی از کامپیوتر 305 RAMAC معرفی کرد. اکثر دادههای دیجیتال، امروزه بر روی هارد دیسکهای مغناطیسی و یا بر روی دیسکهای نوری مانند سی دی ذخیره میشوند. تا سال 2002 بیشتر اطلاعات ذخیره شده بر روی دستگاه آنالوگ بود امّا همان سال بود که حافظههای دیجیتالی برای اولین بار از آنالوگها پیشی گرفتند تا جایی که در سال 2007، حدود 94% اطلاعات جهان به شکل دیجیتالی نگه داری میشدند. 52% بر روی هارد دیسکها، 28% بر روی دیسکهای نوری و 11% آنها بر روی نوارهای دیجیتالی مغناطیسی. تخمین زده شده که ظرفیت جهان برای ذخیرهی اطلاعات بر روی دستگاههای الکترونیکی از کمتر از 3 اگزابایت در سال 1986 به 295 اگزابایت در سال 2007 رسیده که تقریباً هر سه سال رشد دو برابری داشته است.
[font=IRANSans]
نوارهای پانچی که برای نمایش اطلاعات در کامپیوترهای اولیه از آنها استفاده میشد.[/font]
پایگاههای داده
سیستمهای مدیریت پایگاه داده در دههی 60 میلادی برای حل مشکل ذخیره و بازیابی دقیق و سریع اطلاعات در حجم زیاد، ظهور کردند. یکی از اولین سیستمهای مدیریت پایگاه داده، سیستم مدیریت اطلاعات IBM بود (IMS) که تا 50 سال بعد از آن استفاده گسترده میشده است. IMS دادهها را بر اساس سلسله مراتب مرتب میکند اما در دههی 70، تد کاد (Ted Codd)، به عنوان جایگزین، مدل حافظه رابطهای را بر اساس نظریه مجموعهها پیشنهاد کرد و منطبق بر منطق و مفاهیم شناخته شده از جداول، ردیفها و ستونها بود. در سال 1980، اولین سیستم مدیریت پایگاه داده رابطهای (RDBMS) که به فروش عمومی رسید، در اوراکل (Oracle) در دسترس بود.
همهی سیستمهای مدیریت پایگاه داده از اجزایی تشکیل میشوند که این اجزا باهم موجب دسترسی همزمان چند کاربر به اطلاعات ذخیره شده هنگام حفظ یکپارچگی آن میشوند. یک ویژگی همهی پایگاههای داده این است که ساختار دادهای که ذخیره میکنند به طور جداگانه از خود داده در شَمای پایگاه داده (database schema) تعریف و نگه داری میشود.
زبان نشانه گذاری توسعه پذیر (XML) ، در سالهای اخیر به فرمت مشهوری برای نمایش دادهها تبدیل شده است. اگرچه دادههای XML میتوانند در فایل سیستمهای معمولی ذخیره شوند امّا معمولاً جهت پیاده سازی قدرتمندی که طی سالها تلاش عملی و تئوری تأیید شده است، در پایگاه دادههای رابطهای نگه داری میشوند. به عنوان نسخهی تکامل یافتهی زبان استاندارد نشانه گذاری عمومی (SGML) ساختار XML های متن محور دارای ویژگی که انسان و ماشین قادر به خواندن آن هستند.
متن زیر عکس: ابزار SQL در پایگاه داده
بازیابی اطلاعات
مدل پایگاه دادهی رابطهای، زبان برنامهنویسی مستقل SQL را بر اساس جبر رابطهای معرفی کرد.
اصطلاحات «داده» و «اطلاعات» مترادف یکدیگر نیستند. هر چیزی که ذخیره میشود، داده است امّا فقط وقتی تبدیل به اطلاعات میشود که سازماندهی شده و برای هدف خاصی ارائه شود. اغلب دادههای دیجیتالی دنیا بدون ساختار هستند و با فرمتهای مختلفی ذخیره شدند. حتی در یک سازمان واحد. در دههی 80، انبارهای داده شروع به پیشرفت در راستای ادغام این ذخایر متمایز کردند. معمولاً آنها شامل دادههای استخراج شده از منابع گوناگونی مانند اینترنت هستند که جهت تسهیل کار سیستمهای پشتیبانی تصمیم (DSS) سازماندهی شدهاند.
مخابرهی داده
مخابرهی داده دارای سه بخش است: مخابره، انتشار و دریافت که به طور وسیع میتواند به عنوان «پخش» که طی آن اطلاعات به طور یک طرفه و سرازیری مخابره شوند یا به عنوان «ارتباطات مخابراتی» با کانالهای دو طرفهی سربالایی و سرازیری در نظر گرفته شود.
از اوائل دههی 2000 میلادی، XML به طور قابل توجهی به معنای مبادلهی داده به کار گرفته شده است. علی الخصوص برای فعل و انفعالات ماشین محور مانند پروتکلهای وب محوری مثل SOAP که وضعیت دادههای در حال مخابره را توصیف میکند نه دادههای ساکن. یکی از چالشهای پیش روی این نوع استفاده، تبدیل دادهها از پایگاه دادههای رابطهای به مدل شی گرای سند (DOM) میباشد.
تغییرات دادهها
هیلبرت و لوپز سرعت نمایی تغییرات فناوری (نوعی از قانون مور) را شناسایی کرده کردهاند: بین سالهای 1986 تا 2007، سرانهی ظرفیت کاربرد خاص محاسبهی اطلاعات تقریباً هر 14 ماه دو برابر و طی این دو دهه، سرانهی ظرفیت کاربردهای عمومی کامپیوتر، در دنیا، هر 18 ماه دو برابر؛ سرانهی جهانی ظرفیت ارتباطات مخابراتی هر 34 ماه دو برابر؛ سرانهی ظرفیت حافظهی مورد نیاز دنیا تقریباً هر 40 ماه دوبرابر (هر سه سال) و سرانهی پخش اطلاعات هر 12.3 سال یک بار دو برابر میشده است.
هر روز در سراسر جهان، مقادیر کلان داده ذخیره میشوند ولی فقط در صورتی که بتوانند آنها را تحلیل و به طور کارآمد ارائه کنند در جایی که به آن «آرامگاه» (tomb) (آرشیوهای دادهای که به ندرت بازدید میشوند.) گفته میشود، اقامت میدهند. برای رسیدگی به این مسئله، زمینهی دادهکاوی (data mining)، (روند کشف الگوهای قابل توجه و کسب اطلاعات از مقادیر بزرگ داده) در اواخر دههی 80 میلادی ظهور کرد.
ذخیره داده
اولین کامپیوترهای الکترونیکی مانند Colossus از نوار پانچ استفاده میکردند که نوار بلند کاغذی بود که سری سوراخهای روی آن، نمایانگر اطلاعات بودند. در حال حاضر این تکنولوژی منسوخ شده است. پیشینهی حافظهی الکترونیکی که در کامپیوترهای مدرن استفاده میشود به زمانی برمیگردد که در جنگ جهانی دوم یک نوع حافظهی تأخیر خط برای حذف در هم ریختگی در سیگنال رادارها ساخته شد. اولین کاربرد عملی آن تأخیر خط جیوه بود. اولین حافظه تصادفی دیجیتالی، Williams tube نام داشت که استاندارد آن بر اساس پرتوی لامپ کاتدی بود اما اطلاعات ذخیره شده روی آن و حافظهی تأخیر خط، فرّار بود که باید به طور مداوم تازه میشد و در نتیجه پس از هربار قطع برق، از بین میرفت. اولین کامپیوتر که حافظهی آن فرّار نبود، magnetic drum نام داشت که در سال 1932 اختراع شد که در Ferranti Mark 1 ، اولین کامپیوتری که به فروش عمومی رسید، استفاده میشد.
IBM در سال 1956 اولین هارد دیسک خود را به عنوان جزئی از کامپیوتر 305 RAMAC معرفی کرد. اکثر دادههای دیجیتال، امروزه بر روی هارد دیسکهای مغناطیسی و یا بر روی دیسکهای نوری مانند سی دی ذخیره میشوند. تا سال 2002 بیشتر اطلاعات ذخیره شده بر روی دستگاه آنالوگ بود امّا همان سال بود که حافظههای دیجیتالی برای اولین بار از آنالوگها پیشی گرفتند تا جایی که در سال 2007، حدود 94% اطلاعات جهان به شکل دیجیتالی نگه داری میشدند. 52% بر روی هارد دیسکها، 28% بر روی دیسکهای نوری و 11% آنها بر روی نوارهای دیجیتالی مغناطیسی. تخمین زده شده که ظرفیت جهان برای ذخیرهی اطلاعات بر روی دستگاههای الکترونیکی از کمتر از 3 اگزابایت در سال 1986 به 295 اگزابایت در سال 2007 رسیده که تقریباً هر سه سال رشد دو برابری داشته است.
[font=IRANSans]
نوارهای پانچی که برای نمایش اطلاعات در کامپیوترهای اولیه از آنها استفاده میشد.[/font]
پایگاههای داده
سیستمهای مدیریت پایگاه داده در دههی 60 میلادی برای حل مشکل ذخیره و بازیابی دقیق و سریع اطلاعات در حجم زیاد، ظهور کردند. یکی از اولین سیستمهای مدیریت پایگاه داده، سیستم مدیریت اطلاعات IBM بود (IMS) که تا 50 سال بعد از آن استفاده گسترده میشده است. IMS دادهها را بر اساس سلسله مراتب مرتب میکند اما در دههی 70، تد کاد (Ted Codd)، به عنوان جایگزین، مدل حافظه رابطهای را بر اساس نظریه مجموعهها پیشنهاد کرد و منطبق بر منطق و مفاهیم شناخته شده از جداول، ردیفها و ستونها بود. در سال 1980، اولین سیستم مدیریت پایگاه داده رابطهای (RDBMS) که به فروش عمومی رسید، در اوراکل (Oracle) در دسترس بود.
همهی سیستمهای مدیریت پایگاه داده از اجزایی تشکیل میشوند که این اجزا باهم موجب دسترسی همزمان چند کاربر به اطلاعات ذخیره شده هنگام حفظ یکپارچگی آن میشوند. یک ویژگی همهی پایگاههای داده این است که ساختار دادهای که ذخیره میکنند به طور جداگانه از خود داده در شَمای پایگاه داده (database schema) تعریف و نگه داری میشود.
زبان نشانه گذاری توسعه پذیر (XML) ، در سالهای اخیر به فرمت مشهوری برای نمایش دادهها تبدیل شده است. اگرچه دادههای XML میتوانند در فایل سیستمهای معمولی ذخیره شوند امّا معمولاً جهت پیاده سازی قدرتمندی که طی سالها تلاش عملی و تئوری تأیید شده است، در پایگاه دادههای رابطهای نگه داری میشوند. به عنوان نسخهی تکامل یافتهی زبان استاندارد نشانه گذاری عمومی (SGML) ساختار XML های متن محور دارای ویژگی که انسان و ماشین قادر به خواندن آن هستند.
متن زیر عکس: ابزار SQL در پایگاه داده
بازیابی اطلاعات
مدل پایگاه دادهی رابطهای، زبان برنامهنویسی مستقل SQL را بر اساس جبر رابطهای معرفی کرد.
اصطلاحات «داده» و «اطلاعات» مترادف یکدیگر نیستند. هر چیزی که ذخیره میشود، داده است امّا فقط وقتی تبدیل به اطلاعات میشود که سازماندهی شده و برای هدف خاصی ارائه شود. اغلب دادههای دیجیتالی دنیا بدون ساختار هستند و با فرمتهای مختلفی ذخیره شدند. حتی در یک سازمان واحد. در دههی 80، انبارهای داده شروع به پیشرفت در راستای ادغام این ذخایر متمایز کردند. معمولاً آنها شامل دادههای استخراج شده از منابع گوناگونی مانند اینترنت هستند که جهت تسهیل کار سیستمهای پشتیبانی تصمیم (DSS) سازماندهی شدهاند.
مخابرهی داده
مخابرهی داده دارای سه بخش است: مخابره، انتشار و دریافت که به طور وسیع میتواند به عنوان «پخش» که طی آن اطلاعات به طور یک طرفه و سرازیری مخابره شوند یا به عنوان «ارتباطات مخابراتی» با کانالهای دو طرفهی سربالایی و سرازیری در نظر گرفته شود.
از اوائل دههی 2000 میلادی، XML به طور قابل توجهی به معنای مبادلهی داده به کار گرفته شده است. علی الخصوص برای فعل و انفعالات ماشین محور مانند پروتکلهای وب محوری مثل SOAP که وضعیت دادههای در حال مخابره را توصیف میکند نه دادههای ساکن. یکی از چالشهای پیش روی این نوع استفاده، تبدیل دادهها از پایگاه دادههای رابطهای به مدل شی گرای سند (DOM) میباشد.
تغییرات دادهها
هیلبرت و لوپز سرعت نمایی تغییرات فناوری (نوعی از قانون مور) را شناسایی کرده کردهاند: بین سالهای 1986 تا 2007، سرانهی ظرفیت کاربرد خاص محاسبهی اطلاعات تقریباً هر 14 ماه دو برابر و طی این دو دهه، سرانهی ظرفیت کاربردهای عمومی کامپیوتر، در دنیا، هر 18 ماه دو برابر؛ سرانهی جهانی ظرفیت ارتباطات مخابراتی هر 34 ماه دو برابر؛ سرانهی ظرفیت حافظهی مورد نیاز دنیا تقریباً هر 40 ماه دوبرابر (هر سه سال) و سرانهی پخش اطلاعات هر 12.3 سال یک بار دو برابر میشده است.
هر روز در سراسر جهان، مقادیر کلان داده ذخیره میشوند ولی فقط در صورتی که بتوانند آنها را تحلیل و به طور کارآمد ارائه کنند در جایی که به آن «آرامگاه» (tomb) (آرشیوهای دادهای که به ندرت بازدید میشوند.) گفته میشود، اقامت میدهند. برای رسیدگی به این مسئله، زمینهی دادهکاوی (data mining)، (روند کشف الگوهای قابل توجه و کسب اطلاعات از مقادیر بزرگ داده) در اواخر دههی 80 میلادی ظهور کرد.