۱- تعـریف متغیرها و وارد کردن داده ها
برای انجام محاسبات کامپیوتری با برنامه SPSS، ابتدا باید دادههای گردآوری شده را وارد برنامه کرده، ویژگیهای آنها را برای برنامه تعریف کنیم و در مرحله بعد به پردازش و اصلاحاتی مانند برطرف کردن خطاهایی که طی گردآوری دادهها و انتقال آنها به برنامه پیش میآید بپردازیم تا برای محاسبات آماری آماده شود. صفحه کاربری SPSS دارای دو پنجره است، یکی نمای متغیرها (Variable View) و دیگری نمای دادهها (Data View) که زبانه آنها در سمت چپ و پایین صفحه مشاهده میشود. نرم افزار پنجره های دیگری نیز دارد، پنجره output برای مشاهده خروجی های نرم افزار و پنجره script برای برنامه نویسی در نرم افزار.
در این بخش نحوه تعریف متغیرها و سپس نحوه ورود دادهها در برنامه SPSS آموزش داده میشود.
۱٫ تعریف متغیرها
به طور معمول (در پژوهشهای مبتنی بر پرسشنامه) منظور از متغیر، سوالات پرسشنامه است. سوالاتی مثل جنس، سن، تحصیلات، معدل و غیره هر کدام یک متغیر محسوب میشوند و باید هر کدام از آنها را به عنوان یک متغیر در برنامه تعریف کرد. دقت شود که هر سوال پرسشنامه، یک متغیر محسوب میشود .
برای مثال، در پرسشنامهای، ما با ۳۱ سوال (۱۳ سوال مربوط به خصوصیات استاد، ۵ سوال مربوط به تمایل به آموختن برنامه SPSS و …) مواجه هستیم و باید ۳۱ متغیر در برنامه تعریف کنیم. در ادامه به نحوه تعریف متغیرها میپردازیم و متغیرهای جنس افراد (زن یا مرد بودن) و سن پاسخگویان را به عنوان تمرین و مثال در برنامه تعریف میکنیم.
توجه: با اجرای نرم افزار SPSS دو فایل باز میشود، یک فایل دادهها و تعریف متغیرها (با پسوند .sav) و دیگری فایل خروجی نتایج و آنالیز (با پسوند .spv) است که هر یک باید جداگانه ذخیره شوند. برخی برای راحتی کار و ذخیره همه دستورات و آنالیزهایی که بر روی یک سری داده انجام شدهاند، آنها را در فایلی دیگر به نام Syntax (با پسوند.sps) ذخیره میکنند.
برای تعریف متغیرها باید وارد پنجره (Variable View) شویم. در این پنجره همان طور که مشخص است ۱۱ ستون (در نسخههای پایینتر ۱۰ ستون) وجود دارد که هر ستون مربوط به تعریف و تعیین یک خصوصیت متغیر است.
نکته: گاهی تنها تعریف نام متغیر ضرورت دارد و ضرورتی به تعریف سایر خصوصیات متغیر نیست. اما چنانچه متغیر ما در سطح اسمی یا ترتیبی باشد لازم است مقادیر کد یا ارزشهای متغیر هم تعریف گردد.
نکته: همیشه قبل از تعریف کردن متغیرها و ورود داده ها، پرسشنامههای حاوی اطلاعات را شماره گذاری کرده و در برنامه اولین متغیری که تعریف میکنیم متغیر شماره پاسخگو یا شماره پرسشنامه باشد.
مثال: تعریف متغیر جنس (زن و مرد)
برای فعال کردن هر خانۀ مربوط به تعریف متغیرها کافی است در داخل خانهها کلیک کرده و روی کادر یا علامت ظاهر شده مجددا کلیک کنیم.
نام گذاری (Name)
در کادر NAME نامی برای متغیر خود انتخاب میکنیم. در نسخههای جدید برنامه میتوانیم اسامی را فارسی بگذاریم ولی در نسخههای قدیمی تر ممکن است با مشکلاتی در فارسی نوشتن نامها مواجه شویم. همچنین بدین دلیل که قراردادن فاصله بین کلمات در کادر نام امکان پذیر نیست باید یا نامها را تک کلمهای انتخاب کرد و یا بین دو کلمه به جای قراردادن فاصله، یک علامت مانند نقطه قرار داد. موارد زیر را باید در نگارش نام متغیرها رعایت کرد:
- نام متغیر در نسخههای قدیمی نباید بیش از ۸ کاراکتر (نه حرف) باشد.
- نام متغیر را نمیتوان با یک عدد یا علامت (مانند !، ؟، * یا @) شروع کرد، اما میتواند شامل حروف (کوچک یا بزرگ)، اعداد یا یکی از کاراکترهای @ ، _ $ ، ÷ ، × ، € و … یا نقطه باشد. اگر از کاراکترهای غیرمجاز استفاده کنیم، هنگام خارج شدن از ستون نام، برنامه پیام خطا خواهد داد و نام گذاری انجام نخواهد شد.
- بین کاراکترهای نام متغیر، نباید فاصله وجود داشته باشد.
- در نام گذاری، حروف کوچک و بزرگ با یکدیگر فرقی ندارند.
- نام متغیر باید یکتا یعنی منحصر به فرد باشد (دو متغیر نمیتوانند نام یکسان داشته باشند).
- نباید با یک نقطه یا خط تمام شود.
- کلمات کلیدی مانند ALL ، AND ، BY ، EQ ، GE ، LE ، LT ، NE ، NOT ، OR ، TO و WITH که spss از آنها به عنوان عبارتهای محاسباتی و منطقی استفاده میکند، نباید به تنهایی به عنوان اسم متغیر قرار گیرند.
در جدول ۱، به توضیح کاربرد هرکدام از اجزای پنجره تعریف متغیرها پرداخته شده است.
جدول ۱- کاربرد اجزاء مختلف پنجره تعریف متغیر
نام ستون | نام خصوصیت | کاربرد و نحوه تعریف |
Name | نام | برای انتخاب نام هر متغیر استفاده میگردد. نام متغیر را تا حد امکان کوتاه انتخاب میکنیم. |
Type | نوع متغیر (داده) | برای تعیین ماهیت داده استفاده میشود مانند عددی یا حرفی بودن داده. پیش فرض برنامه Numeric (عددی) بوده و چون دادهها باید در برنامه به صورت عددی وارد شوند نیازی به تغییر نوع متغیر نیست. |
Width | عرض (تعدادکاراکترها) | برای تعیین تعداد ارقام متغیر استفاده میشود . پیش فرض برنامه برای دادههای عددی ۸ کاراکتر است که دو رقم آن برای اعشار در نظر گرفته میشود . اگر داده هایی که وارد میکنیم در این عرض نگنجد، برنامه عدد را گرد میکند. |
Decimals | تعداد اعشار | برای تعیین تعداد کاراکترهای اعشاری به کار میرود و در متغیرهای کمّی کاربرد دارد. چنانچه متغیر ما فاقد اعشار باشد میتوانیم تعداد اعشار را برابر صفر قرار دهیم. پیش فرض برنامه قراردادن ۲ رقم اعشار برای هر متغیر است. |
Label | برچسب متغیر | ارائه عبارت یا توضیحاتی در مورد سوال است که به ما در یادآوری نوع سوال کمک میکند. اگر سوال طولانی باشد میتوان در ستون نام، نامی کوتاه برای آن انتخاب کرد و در بخش برچسب، کل عبارت را نوشت. |
Values | کد یا ارزشها | ارزشها یا کدهای هر متغیر در این قسمت وارد میشود . معمولا فقط برای متغیرهای اسمی و ترتیبی استفاده میشود . در واقع به هرکدام از طبقات متغیرها یک کد (عدد) اختصاص میدهیم. |
Missing | مقادیر نامشخص | ارزش یا عددی را که برای مقادیر نامشخص (ناقص) در نظر گرفته ایم، در این بخش وارد میکنیم. (بهتر است این قسمت به حال خودش و به صورت پیش فرض رها شود) |
Columns | عرض ستونها | میتوانیم عرض ستون هر متغیر را کوچکتر یا بزرگتر کنیم. |
Align | چیدمان | به نحوه چینش مقادیر اختصاص دارد. میتوانیم دادهها را در خانهها به صورت راست چین، وسط چین و چپ چین انتخاب کنیم. |
Measure | سطح سنجش | مقیاس و سطح سنجش متغیرها را تعیین میکنیم. انتخاب سطح سنجش هیچ گونه تاثیری در نتایج ندارد. |
نوع متغیر (Type)
معمولاً دو نوع رایج متغیر یعنی عددی (Numeric) و کاراکتری (String) داریم. مقادیر عددی مثل سن و نمره و … و مقدار کاراکتری مثل جنسیت (زن و مرد، یا نوع رنگ و …). بهتر است نوع متغیر عددی (Numeric) تعین شود و نوع کاراکتری نیز به عددی تبدیل شود (مثلاً عدد ۱ را به زن و عدد ۲ را به مرد اختصاص دهیم که این در ستون Value قابل انجام است).
- Numeric: برای متغیرهای کمی بکاربرده میشود . اگر متغیر طبقهای باشد، بهتر است از نوع Numericاستفاده شود، مثل جنسیت کارکنان که با کدهای ۱ و ۲ نشان داده میشود .
- Comma: مقادیر را سهرقم سهرقم با کاما جدا میکند.
- Dot: مقادیر را سهرقم سهرقم با نقطه جدا میکند.
- Scientific notation: اعداد را به صورت نماد علمی نشان میدهد.
- Date: برای نشان دادن تاریخ (مانند تاریخ تولد ، تاریخ استخدام) به کار برده میشود .
- : Dollarبرای نشان دادن مقادیر به صورت دلار مورد استفاده قرار میگیرد.
- Custom Currency: برای نشان دادن مقادیر واحدهای پولی دیگر بکار برده میشود .
- String: برای متغیرهای رشتهای (مانند اسم کارکنان یا اسم شرکت ها) استفاده میشود
پهنا (Width)
در این قسمت، پهنای مورد نظر رو برای دادهها تعیین میکنید. منظور از پهنا، تعداد کاراکتری هست که هر داده میتواند داشته باشد که البته معمولاً در مورد دادههایی که از نوع String هستن کاربرد دارد مثلا اگر آن را ۵ بگذارید، هنگام ورود دادهی مورد نظر در صفحه Data View، حداکثر تا ۵ کاراکتر قابل تایپ است نه بیشتر.
تعیین اعشار (decimals)
در کادر Decimals میتوانیم تعداد اعشار متغیرهای عددی را تغییر بدهیم. به طور پیش فرض تعداد ۲ رقم اعشار برای متغیرها درنظر گرفته شده است. در مورد متغیر جنس چون تنها با دو عدد ۱ و ۲ مواجه هستیم، نیازی به اعشار نداریم و تعداد اعشار را صفر قرار میدهیم.
تعریف برچسب (Label)
گاهی اوقات ممکن است نیاز به ارائه توضیحاتی در مورد نام متغیر باشد. این توضیح میتواند به زبان فارسی نوشته شود و اغلب در خروجیهای نرم افزار این برچسب به جای نام اصلی متغیر ظاهر میشود که باعث میشود درک خروجی راحت تر باشد. در سلول یا همان کادر زیر Label، برچسب هر متغیر را مینویسیم. متغیر جنس نیازی به توضیح بیشتر ندارد و برخورداری از نام کفایت میکند. قواعدی که در نام گذاری متغیرها صادق است، در مورد تعریف کردن برچسب متغیرها در ستون Label صدق نمیکند. برای متغیر جنس پاسخ گویان ضرورتی به تعریف سایر مشخصات (تعیین نوع متغیر، عرض ستون، تعریف برچسب، تعداد اعشار و تعریف دادههای ناقص) و تغییر پیش فرضهای آنان نیست و تعریف این مشخصات اختیاری است.
کدگذاری (Value)
با کلیک روی خانه مربوطه و کلیک روی نقطه چین ،پنجرهای به صورت زیر باز میشود . در کادر Value کد یا عددی را که برای هر طبقه در نظر گرفته ایم مینویسیم. متغیر جنس از دو طبقه زن و مرد تشکیل شده است که ما به صورت قراردادی به زنان کد ۱ و به مردان کد ۲ را اختصاص میدهیم. جنس افراد متغیری اسمی است و شامل دو طبقه مرد و زن میشود . در برنامه SPSS ، مقدار هر متغیر را با عدد نشان داده و تعریف میکنیم. در نتیجه ما باید به جای این که در برنامه، در ستون مربوط به جنس افراد بنویسیم زن یا مرد؛ زن یا مرد بودن افراد را باید با عدد مشخص کنیم (کدگذاری). رایج است که برای تعریف متغیرهای اسمی و ترتیبی از اعداد تک رقمی استفاده میکنند و به اولین طبقه کد یا ارزش ۱ را میدهند و به طبقه دیگر ۲ و به همین شکل الی آخر. در مثال مربوط به جنس افراد نیز چون ما با دو طبقه زن یا مرد روبرو هستیم در نتیجه باید به یک طبقه کد ۱ و به طبقه دیگر کد ۲ بدهیم. در متغیرهای اسمی (مثل قومیت، وضعیت تاهل و دین) تفاوتی وجود ندارد که به کدام متغیر چه ارزش یا کدی را اختصاص بدهیم. در نتیجه ما به طور اختیاری به کسی که زن باشد در برنامه کد ۱ میدهیم و به کسی که مرد باشد در برنامه کد ۲ میدهیم.
چنانچه متغیر ما ترتیبی (میزان تحصیلات یا میزان درآمد شامل سه طبقه کم درآمد، میان درآمد و پر درآمد) باشد باید ترتیب طبقات لحاظ گردد و کدگذاری متناسب با رتبه و ترتیب طبقات باشد. مثلا اگر تحصیلات افراد را به صورت ترتیبی سنجیده و طبقات شامل سیکل، دیپلم، کارشناسی و کارشناسی ارشد باشد، در این صورت باید ترتیب کددهی متناسب با میزان تحصیلات افراد باشد و به سیکل کد ۱ ، به دیپلم کد ۲ ، به کارشناسی کد ۳ و به کارشناسی ارشد کد ۴ اختصاص بدهیم. در مورد متغیرهایی که در قالب طیف لیکرت سنجیده شدهاند نیز این نکته باید رعایت شود. مثلا در یک طیف سه گزینه ای؛ به مخالفم کد ۱ ، به بی نظر کد ۲ و به موافقم کد ۳ اختصاص میدهیم.
نکته: کدگذاری طبقات متغیرهای اسمی تنها جهت سهولت ورود اطلاعات به کامپیوتر است و کدگذاری به هیچ وجه به معنای کمّی شدن طبقات نیست و به این معنا نیست که زن معادل عدد ۱ است و مرد معادل عدد ۲ است. همچنین برای متغیرهای فاصلهای/ نسبی (مانند سن، معدل یا بهره هوشی)، کدگذاری صورت نمیگیرد و نمره افراد در این متغیرها به طور مستقیم وارد برنامه میشود .
دادههای گم شده (Missing)
در این قسمت تنظیمات مربوط به شناساندن مشاهدات مفقود (یا گمشده یا بی پاسخ) به SPSS وجود دارد. با کلیک روی خانه مربوطه و کلیک روی نقطه چین ،پنجرهای به صورت مقابل باز میشود . گزینه پیش فرض نرم افزار گزینه No missing values است. پیشنهاد ما استفاده از این گزینه است. با استفاده از این گزینه هنگام ورود دادهها نیاز به کار خاصی نیست و تنها کافیست خانه مورد نظر را خالی رها کنید. نرم افزار خانههای خالی را به عنوان missing شناسایی میکند. البته بهتر است این گزینه را به حالت پیش فرض خودش رها کنید.
اما ممکن است بنا به دلایل خاصی (مثلا تمایز قایل شدن بین بی پاسخها و پاسخهای مخدوش) بخواهید خودتان مقادیری را به نرم افزار به عنوان مشاهدات گمشده معرفی کنید.با انتخاب گزینه Discrete missing values میتوانید تا سه مقدار به عنوان مشاهدات missing به نرم افزار معرفی کنید. توجه کنید که مقادیر اختصاص داده شده بایستی با مقادیر موجود در مشاهدات متفاوت باشند. به عنوان مثال اگر متغیر شما سن افراد باشد اختصاص عدد ۳۰ برای مشخص کردن مشاهده گمشده منطقی نیست و مثلا میتوانید از اعداد ۱- یا ۹۹۹ استفاده کنید. گزینه سوم با عنوان range plus one optional discrete missing value امکان این را فراهم میکند که دامنه خاصی از مقادیر را به عنوان مشاهده گمشده تعریف کنید. مثلا اگر بخواهید اعداد بین ۱۰ تا ۲۰ به عنوان مشاهده گمشده معرفی شوند، در قسمت low عدد ۱۰ و در قسمت high عدد ۲۰ را وارد کنید. همچنین میتوانید یک مقدار اختیاری را نیز به عنوان missing تعریف کنید. مثلا اگر قصد داشته باشید عدد ۹۹ را برای اینکار اختصاص دهید، در باکس آخر عدد ۹۹ را وارد کنید. در پایان روی دکمه ok کلیک کنید.
پهنای ستون (Columns)
برای تغییر عرض یا همان پهنای ستون دادههای متغیر، در کاربرگ Data View میباشد. روش تغییر پهنای ستون همانند روش شرح داده شده در ستونهای Width و Decimals میباشد.
چیدمان (Align)
در کادر Align میتوانیم طریقه چینش داده را در درون هر خانه تغییر بدهیم. برای نمونه میتوانیم با کلیک در درون هر خانه، طریقه چینش متغیرها را وسط چین (Center) انتخاب کنیم.
سطح سنجش (Measure)
در این کادر میتوانیم سطح سنجش متغیر یا به عبارتی مقیاس متغیر را انتخاب کنیم. جنس افراد، متغیری اسمی است. در نتیجه در کادر مربوطه، گزینه Nominal (اسمی) را انتخاب میکنیم. (Ordinal به معنای رتبهای و Scale معادل وزنی یا به عبارتی فاصلهای و نسبی است).
نقش (Role)
در این ستون میتوان مشخص کرد که متغیر مورد نظر از چه نقشی برخوردار است: از نوع داده ورودی (Input)، هدف (Target)، هردو (Both)، هیچکدام (None)، تفکیک کننده (Partition) ، یا جداساز (Split)
- Inputکه نقش یک متغیر ورودی را بازی خواهد کرد (مانند متغیرهای مستقل، متغیرهای پیشبین در رگرسیون)
- Targetکه نقش یک متغیر هدف را بازی خواهد کرد (مانند متغیر وابسته در رگرسیون؛ وابسته و پاسخ)
- Bothکه هم به صورت ورودی و هم ستاده به کار گرفته میشود .
- Noneکه به آن هیچ نقشی واگذار نشده است.
- Partitionکه از آن برای بخشبندی دادهها به صورت نمونههای جداگانه برای یاد دادن، آزمون و اعتبار استفاده میشود (برای مثال در سری زمانی و شبکههای عصبی، یا مثلاً میتوان سطح تحصیلات را تقسیمبندی کرد).
- Split که مثلاً میتوان زن و مرد را جداگانه بررسی کرد.
توجه: در رابطه با نقش متغیرها به دو نکته توجه کنید ۱-اگر نقش متغیری مشخص نشود، سیستم نقش آن را به عنوان ورودی ثبت میکند.۲- اختصاص نقشها تنها روی دیالوگهایی اثر خواهد داشت که نقش متغیر را پشتیبانی میکنند، و تاثیری بردستورات نخواهند داشت.
شکل زیر نحوه تعریف متغیر جنس را نشان میدهد.
۲٫ وارد کردن داده ها:
بعد از تعریف متغیرها در پنجره متغیرها (Variable View)، وارد پنجره دادهها (Data View) میشویم. در این پنجره باید اطلاعات مربوط به پاسخگویان یا اطلاعات پرسشنامهها را وارد نماییم.
در هنگام وارد کردن دادهها در پنجره داده ها، به صورت ردیفی یا سطری پیش میرویم و در هر مرحله تمامی اطلاعات مربوط به یک پاسخگو را وارد برنامه میکنیم. به طور معمول، هر ردیف نشان دهنده یک پاسخگو و هر ستون نشان دهنده یک متغیر است.
اجرا:
ابتدا تمام پرسشنامهها را از عدد ۱ شروع به شماره گذاری میکنیم. شمارهگذاری پرسشنامهها در مرحله بازبینی و اصلاح به ما کمک میکند تا اشتباهات را یافته و تصحیح نماییم. ضمنا از دوباره کاریهای احتمالی جلوگیری کرده و به فرآیند وارد کردن اطلاعات نظم میبخشد.
نکته: بعد از اینکه همه متغیرها را در پنجره متغیرها تعریف کردیم به پنجره دادهها میدهیم. همچنین در هر مرحله اطلاعات یک پاسخگو یا پرسشنامه را وارد مینماییم و بعد از این که اطلاعات هر پاسخگو به طورکامل وارد شد، به سراغ پاسخگوی بعدی میرویم.
شکل بالا مربوط به پنجره دادهها بوده و درآن اطلاعات پاسخگویان وارد برنامه شده است. مطابق شکل، هر سطر نشان دهنده یک پاسخگو است و هر ستون نیز اختصاص به یک متغیر دارد. مثلا در مورد سطر مشخص شده باید گفت که ستون اول (موردها) نشان دهنده شماره پاسخگو یا شماره پرسشنامه است و از ۱ شروع شده و به ترتیب بالا میرود (۲، ۳، ۴ و …). ستون دوم (جنس) نشان دهنده متغیر جنس (جنسیت افراد) پاسخگو است که برابر با ۱ است و نشان میدهد که پاسخگوی اول زن است (۱ را به عنوان زن و ۲ را به عنوان مرد در نظر گرفته است). ستون سوم (تحصیلات) نشان دهنده سطح تحصیلات افراد است و سطح تحصیلات فرد اول برابر با ۱ است (کد ۱ به عنوان دیپلم در نظر گرفته شده). ستون چهارم به عنوان متغیر قند خون است که فرد اول مقدار قند خونش برابر ۹۰ بوده است و سایر متغیرها نیز به همین ترتیب تعریف شدهاند. (مطالب تعریف متغیر و وارد کردن دادهها، با تغییراتی برگرفته از کتاب “راهنمای آسان تحلیل آماری با SPSS” تالیف رامین کریمی، و نیز وبسایت datafit.blog.ir، aminarticle.com و … میباشد)
فایل tree-car.sav از مجموعه فایلهای مثال در نرم افزار SPSS
نمایی از صفحه تعریف متغیرها:
نمایی از صفحه ورود دادهها:
نمایی از صفحه فایل خروجی و نتایج حاصل از آنالیز دادهها:
نمایی از صفحه تعریف متغیرهای فایل tree_car.sav:
نمایی از صفحه ورود دادههای فایل tree_car.sav:
مثال ۱:
بخشی از یک پرسشنامه پژوهشی در زیر آمده است. متغییرهای مربوطه را در پنجره Variable view کامل کرده، سپس در پنجره Data View برای هر یک چند نمونه داده وارد کنید.
شماره پرسشنامه: …………
مشخصات فردی: ……………….
محل سکونت (شماره مناطق نهگانه شهر مشهد): ……………… سال تولد: ………… محل تولد: …………..
وضعیت تاهل: ▢ مجرد ▢ متاهل ▢ مطلقه ▢ همسر فوت کرده
عنوان شغل: ……………………………………….
مقدار سنوات خدمت در شغل ذکر شده: ………………
مقدار دقیق درآمد ماهانه (تومان): ……………………………
وضعیت استخدامی: ▢ رسمی ▢ پیمانی ▢ قراردادی ▢ شرکتی ▢ بیکار
تحصیلات: ▢ زیر دیپلم ▢ دیپلم ▢ فوق دیپلم ▢ کارشناسی ▢ ارشد یا دکترا
عنوان مدرک دانشگاهی (در صورت داشتن تحصیلات دانشگاهی): ……………..
مثال ۲:
فایل adl.sav از مجموعه مثالهای نرم افزار SPSS برای تمرین برخی موارد مناسب است. در این فایل اطلاعاتی از افراد مختلف وجود دارد: دیابتی، فشار خون، سیگاری بودن، سن و جنسیت و گروههای تیمار یا شاهد و …