相互評価による同一課題の連続評価

-評価結果をフィードバックさせることによる成果物と評価の変化-

埼玉県立越ヶ谷高等学校教諭中島聡

１．はじめに

不定形な成果物を評価することには悩みが多い。画面構成やコンセプトなど、受け手の価値観に大きく左右される部分があるからだ。特にインターネットなど不特定多数に向けての情報発信を思うと、受け手の価値観を想定することは不可能であり、単一の価値観で評価を下すことは無意味とさえ思える。また、授業を行う前から存在するスキルの差が成果物に与える影響もある。このようなことから、本校では３年前より生徒間相互評価と同一課題の連続評価を行なってきた。その内容と結果を掻い摘まんで報告する。この内容は、埼玉県高等学校情報教育研究会会誌で発表済みのものである。詳しくはそちらを参照して戴きたい。

２.授業実践

(1) ソフトウェア開発と実装

生徒間相互評価をスムーズに行う為にソフトウェアの開発を行なった。４年前より生徒のコンピュータ環境は、Linux、XFree86、KDE、OpenOffice.orgなどのフリーウェアとオープンソースウェアで構築している。認証やファイル共有も、OpenLDAP、Linux-PAM、NFSという具合である。この環境下で、PostgreSQL、Apache＆PHP、Mozilla Firefoxを使い３層構造のWebアプリケーションとして開発した。具体的にはデータベースの設計と設定、PHPによるプログラミングを行なった。評価入力以外にも、集計・結果閲覧、評価項目の設定などの管理用プログラムも作成し続け、現在は40本弱となっている。なお、全てのアクセスには認証が必要であり、入力に於いては入力者情報も同時に登録している。これを不正や不当な入力を防止する為の抑止力としている。また、個々の生徒の評価結果や内容は、被評価者と教員以外は閲覧できないようになっている。

(2) 運用

開発したソフトウェアはいくつかの制限からWebページの評価に使用している。内容は埼玉県立福岡高等学校の鈴木成先生の授業(埼玉県高等学校情報教育研究会会誌第１号「Webページの作成」参照)から拝借させて戴いた。作成時間や作品の規模、評価項目なども鈴木先生の授業がベースである。オリジナルの授業運用に、１回目の相互評価、再作成、２回目の相互評価を追加、評価項目と配点をアレンジ、レポート提出は削除になっている。追加した部分にはそれぞれ約3時間(65分授業)を割り当て、全体ではオリジナルの倍強の時間数となった。相互評価は講座単位で行い、生徒一人が評価する成果物は約40作品である。評価項目数は16〜18。文章によるものが３ないし２で残りは選択肢である。教員も同じソフトウェアで評価する。生徒と教員は区別されないので、教員評価のウェイトは約2.5%となっている。１回目の評価後、生徒は成果物に対する評価内容の確認と分析をする。このときの分析結果を元に、２回目の評価で高い結果を得られるよう改善を行なう。この過程で他者の評価がフィードバックされ、情報受信に対する能力も試される。成績は、各評価項目別の平均値を求め、この値の偏差値を該当する項目の素点とし、この素点(偏差値の平均値)の合計値を最終評価に利用している。この成績は講座中の相対的なもので、講座間に有意な差が生じた場合は補正する必要がある。が、今までにその必要性を感じたことはない。

(3) 結果と考察

家庭内のインフラや中学校までの授業についてアンケートを実施。この結果より、Ａグループ(自分のコンピュータを所有、インターネットに自由接続可)とＢグループ(高校以前にワードプロセッサまでの授業を受けた、またはコンピュータ操作に関する授業を受けていない)を抽出した。２つのグループについて評価(偏差値)の推移をグラフにしたものが図１と２である。

図１

図２

グループごとの平均値と標準偏差の推移は、Ａは(53.81, 3.82)→(50.30, 9.77)→(53.50, 9.14)、Ｂは(44.30,12.24)→(50.16,10.22)→(48.14, 7.92)である。変化点に於いて２つのグループの平均値と標準偏差が極めて近い値になっている。
次に、変化点の成績上位者(偏差値60以上)についても同様なグラフを作成したものが図３である。

図３

  このグループの平均値と標準偏差の推移は(49.59,12.12)→(65.13, 6.13)→(57.46, 9.91)である。初期点の偏差値平均がほぼ50であることと、標準偏差が大きいことから、初期点と変化点には顕著な相関はないと判断できる。つまり、２つの評価は全く別のものと考えても良さそうだ。以上より、同一課題の連続評価における変化点には、次の特徴があると結論した。

    ア.家庭インフラや授業前に生徒が持っているスキルに依存しない。
    イ.初期点と変化点は全く別の評価である。

  初期点は他者の意見が考慮されておらず、言わば独断的な成果物に対する評価である。対して、変化点は他者の意見を重視した成果物に対する評価と考えられる。インフラやスキル面で優位な生徒は、その経験より独断によって作成した成果物で高い評価を得られる可能性が高いが、他者の評価を効果的にフィードバックする能力が高いとは言えない。２つの能力は別のものであることを物語っているようである。

３．おわりに

同一課題を連続で相互評価することにより、他者の評価をフィードバックする能力を評価することができると考えている。これが正しいとすれば、次は他者による評価の正当性や質が問題となるであろう。妥当な評価や、質の高い評価があってこそフィードバックが活きてくる。質の低い評価から良いフィードバックを期待することはできない。即ち、良い評価を行うような指導や方法が必要となる。そして最終的には「生徒の評価内容の評価」を考えなくてはならない。改善方向を決定する様子から、「文章による評価」が重要なファクターになっていることが伺える。デジタルの時代にあっても、アナログの重要性はまだまだ大きいようだ。一方、国語の表現力低下から、満足な文章を書くことができない生徒も相当数存在している。情報伝達の基本である文章に対する合理的かつ効率的に評価する方法を考案する必要がありそうである。国語科の範疇と思えるような事柄で、教科の目標に合致するかは疑問ではあるが、私の最近の大きな懸案となっている。