テスト作成のための条件
同じレベルの複数クラスが同時に同じ試験を受けたが、平均点に大きな差が出た場合にはテストに問題があると考えられる。このときは、テストの信頼性が疑われる。また授業で習わなかったことが中間テストに出題されることがあるかもしれない。その時は、テストの結果が悪かったとしても、生徒が怠けていたとか、能力が低いということにはならない。そのテストは測定すべき内容から判断して妥当でなかったのである。また学習目標と異なる内容のテストが行われた場合には、正当に生徒の力を判断したことにはならない。英文の内容を質問しているのに、文法項目や発音項目を聞いたり、テストのレベルが高すぎたり難しすぎるという場合もある。このようなテストは妥当性に欠くテストである。また、テストを行うのに長時間かかるとか、費用がかかりすぎる場合も良いテストとは言えない。
このように、テストは信頼性、妥当性、実用性を満たさなければならない。テストを作成するための条件として、(1)信頼性 reliability、(2)妥当性 validity、(3)実用性 practicalityがある。
信頼性
信頼性(reliability)とは、テストは測定すべきものをいつもー貫して測定しているかどうかということである。今日実施したテストの結果と先週実施したテストの結果が大きく異なっていれば、信頼性が低いことになる。テストの信頼性とはテストの安定性のことである信頼性の高いテストは、 同レベルの能力の生徒が多数受けても、採点者が異なっても、常に同じ結果が出るテストである。同程度の能力のAクラスとBクラスが同じテストを同時に受けたとする。テストの結果の平均点にたとえば20点以上も差が出た場合は、このテストの信頼性は低いことになる。
妥当性
妥当性(validity)とはテストが測定すべきものを測定しているかを意味している。つまり、テストの妥当性とはテストが測定しようとしているものを本当に測定して いるかどうかの度合いを指す。たとえば、読解力を測定するテストにおいて、 テストの質問項目が文法の知識を尋ねている場合がある。その時は、このテストは妥当性がないと言える。発音をペーパーテストで測る場合も妥当性がないと言えよう。単語の第一アクセントがある箇所を選択させる問題において、たとえ正しい筒所を生徒が選択していても、実際に生徒がその単語を正しく発音できるかどうかは分からない。実際は、本人に発音させてみれば、わかるのであるが、その代用として妥当性の劣るペーパーテストを用いていると言えよう。
実用性
実用性(practicality)とは、テス卜が、作成、実施、採点、及び、解釈をする際に容易で実用的でなければならないことを意味する。どんなに信頼性及び妥当性が高いテス卜であっても、作成するのが困難であれば、実用性が高いとはいえない。
信頼性、妥当性、実用性の関係
こららの信頼性、妥当性、実用性はしばしば相反することがある。信頼性を追求すれば実用性が欠ける場合がある。実用性ばかりを追求すれば妥当性に欠ける場合もある。実際の教育の現場では、それぞれをある程度は妥協して進める必要がある
テストが及ぼす影響
生徒はテストでの高得点を常に目指している。いつも客観テストばかり出題されれば生徒はその対策に専念していく。主観テストばかり出せば、それの対策に一生懸命になる。生徒の学習スタイルを決定するという意味では、信頼性、妥当性、実用性とは別の視点からテスト作成を行う必要性もある。